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1. Definition of stress functions. Completeness. Ifa particular rule enables 
us to find finite algebraic combinations of the derivatives of a set of arbitrary 
functions, possibly supplemented by quantities associated with the geometry 
of the space in question, such that these combinations when substituted for 
the stress tensor satisfy the equations of equilibrium or motion identically in 
the arbitrary functions, the rule is said to furnish a solution in terms of stress 
functions. Such solutions are of two kinds: 

4. Solutions of particular dynamical equations, such as those of linear elasti- 
city, classical fluid mechanics, etc. 

2. Solutions of the dynamical equations valid for all continuous media in 
a particular space. 

In the above statement, the “arbitrary”’ functions are restricted to belong 
to a certain class, such as functions which are four times continuously differen- 
tiable, or harmonic, or biharmonic, but the class must not be specified in terms 
of material properties, nor may it coincide with the class of solutions of the 
original equations, for otherwise the definition would be vacuous. 
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By their definition, stress functions provide sufficient conditions for solving 
the dynamical equations in question. From any such rule, by particularizing 
the arbitrary functions we may derive any number of special exact solutions. 
Thus a solution in stress functions is useful for experimentation in search of 
particular cases, for inverse and semi-inverse methods, ete. But this is not 
enough. We should prove also that the solution so obtained is general, or complete 
Corresponding to any stress field satisfying the given equations there exists at 
least one suitable choice of the stress functions — in a word, that the rule ex- 
presses a necessary as well as a sufficient condition. Only on the basis of a 
theorem of completeness are we justified in inferring from use of the stress 
functions any quality of the theory itself, With such a theorem, however, we 
may, at least in principle, lay aside the differential equations once and for all 
and enjoy the advantages of explicit, finite formulae. 

The second kind of stress functions is obviously of a more embracing nature 
than the first. However, when a solution of the second kind has been found, 
it does not, in general, yield a solution in stress functions for any particular 
material; rather, when a solution of the second kind is substituted into the 
relevant constitutive equations, there results, usually, a system of differential 
or integro-differential or functional equations to be satisfied by the stress func- 
tions. This corresponds to the very nature of constitutive equations, which 
single out among all dynamically possible stresses those compatible with a 
particular kind of material behavior. 

The process just mentioned is not often an efficient one for solution in a 
particular theory. For example, in linear elasticity the stress functions of 
GALERKIN and PAPKOVICH, which are stress functions of the first kind, furnish 
a more practical approach to the solution of special problems and the proof 
of general theorems. But the moment that linear elasticity and closely related 
theories are left behind, these stress functions fail altogether. Stress functions 
of the second kind, however, are valid independently of constitutive equations. 
They should not be looked upon so much as tools to be applied in any special 
theory but as means of finding properties common to all theories and of comparing 
the results of different theories. The rise of various non-linear theories of materials 
in the past decade suggests that applications of this kind, though presently few, 
may soon be much demanded}. 


2. Nature and purpose of this report. Here we consider only the second 
kind of solution, stress functions for general continua?, independent of constitu- 
tive assumptions. Since the ever growing literature, while giving evidence of 
broad and continuing interest, includes many rediscoveries, it has seemed worth- 
while to put in one place all major known results and methods. The derivations 
are carried through in general co-ordinates, yielding results in invariant form, 
and the solutions are proved to be complete within a stated class. 


* Stress functions do not furnish the only possibility of such comparisons. In 
fact, most of the presently known results of this kind have been obtained by Sic- 
NORINI’S theory of stress means; for an exposition, see §§ 220—222 of the forth- 
coming work by TruEspELL & Toupin, The classical field theories, Handbuch der 
Physik III/1, Springer-Verlag. 

» A bibliography of works on stress functions for the classical linear theory of 
elasticity is subjoined at the end of the report. 
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The equations to be solved, in the most general case envisioned, are 
Te ee Oy el ee (2.1) 


where the quantities T*” are the contravariant components of an absolute 
tensor field and where the comma denotes covariant differentiation based upon 
an affine connection in a real space of m dimensions. 

The special character of many results recently published reflects haphazard 
methods, unnecessary had use been made of either of the two known general 
approaches: 

1. Representation of a solenoidal field as the curl of a vector potential. 

2. Use of the principle of virtual work and its converse. 


Both methods should be applicable to curved spaces. That the former method 
has been used only for flat spaces reflects the fact that the general theory of poten- 
tials is unknown for curved spaces. In a flat space of m dimensions, the equation 
Hise eee (0) may be regarded as a system of n? independent vector equations of 
the type V™ ,, = 0, so that the ordinary theorem of the vector potential suffices*. In 
a curved space, the equations 7*” ,,=0 are not known to be reducible to a system 
of equations of the form V™,,,=0, so the fact that the general solution of V” ,,=0 
is known has not led to solution of our problem. The latter method, in its first 
stages, applies equally easily to curved spaces. To get fully explicit results by 
its means, however, the conditions of compatibility in the appropriate space 
must be exhibited. Calculation of the conditions of compatibility and proof of 
the theorem of the vector potential are thus seen to be closely related problems, 
neither of which has been solved for a general curved space. For ordinary curved 
surfaces, however, enough is known that we can illustrate the power of the latter 
method by obtaining the most general equilibrated stresses in several classes of 
curved membranes. 

Both methods, in contrast to the more popular method of hit-or-miss trials, 
yield or imply proofs of completeness. 


3. Mechanical situations to which the results may be applied. In an inertial 
co-ordinate system in a real Euclidean space of three dimensions, the stress 
tensor ¢*” satisfies CAUCHY’s laws of motion 


One OT, jem — ymk (3.1) 


These laws express the local balance of linear momentum and of moment of 
momentum, respectively, on the supposition that there are neither extrinsic 
couples nor couples regarded as representing the actions which maintain material 
continuity. The tensor # is presumed to include any electromagnetic stresses 
that may be present. @ is the density, # the acceleration, and f the extrinsic 
force per unit mass. 

CaucHy’s laws (3.1) assume the form (2.1) in various special cases. 

Case 1. Internally free three-dimensional medium in equilibrium. If #, the 
velocity, is constant and uniform, and if f=0, (3.1) assumes the form (2.1) with 
Pt, 

3 Cf. Finzi & Pasrori [1949, 1, Cap. IV, § 7]. 
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Case 2. Equilibrium of a three-dimensional medium subject to conservative 
extrinsic force. If for some scalar U(a, t) we have 


ef, =—U;,, (3.2) 


and again #—const., (3.1) assumes the form (2.1) if we put T=t—U1. 

In any case, if the general solution of pale Ly is known, all that is needed 
in order to find the general solution of t*”,, = — @ f* is to add a particular integral. 
In rectangular Cartesian co-ordinates, such an integral pt*™ is furnished for 


convex domains by 


|p || = 0 foray “0 (3.3) 


In curved spaces, it may be more difficult to find a particular integral. For 
a Riemannian space, the search for a particular integral may be systematized 
as follows: Let w* be any contravariant vector satisfying the partial differential 


system ee Ro aes) = t08 (3.3.a) 


where R®, is the contracted curvature tensor; then a particular integral of or 
the system (3.1) is given by 
pl = 26 ee (3.3 b) 

The problem of finding a particular integral of the underdetermined tensorial 
equations is thus reduced to that of finding a particular integral of a determinate 
vectorial system of Helmholtz type: V?u=/ (x) u+ g(x). 

Case 3. Steady motion of a three-dimensional medium. In virtue of EULER’S 
equation of continuity, 

2Q 


ay + 0%"), =9, (3.4) 


we may put CAucuy’s first law (3.1), into the form 


ACE) 


ap OO a") + of. (3.5) 


In the case of steady motion subject to no extrinsic force, (3.5) reduces to (2.1), 
if we put T=t— exa, and (2.1), is satisfied in virtue of (3.1). 
Cases 2 and 3 may be combined. 


Case 4. Unsteady motion of a three-dimensional medium. Let indices I’, A 
run from 1 to 4, and retain k, m as indices with range 1 to 3. Put 


Deh = (0) ee oleae aA | (3.6) 
and 
ery =P" ° 
Swell (eee 


and define a stvess-momentum tensor 'T as follows: 


Aer cA IA 
T’*=t4_ evi y4. (3.8) 


* For a flat space, the method is due to SCHAEFER ORs. S SSI 
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Thus, eg., T774=—oV"=T'*", T44=—o. Suppose that f=0, and select rec- 
tangular Cartesian space co-ordinates x*. Then (3.4) and (3.5) together assume 
the form (2.1);, where the comma now stands for partial differentiation. Thus 
the laws of motion in an inertial frame assume the form to which (2.1) would 
reduce 7 space-time were flat. This observation suffices for our later analysis 
of unsteady motion, which does not presume any geometrical structure of space- 
time®. 

Case 5. Plane motion subject to plane stress. When a and t are plane, all 
the foregoing cases become applicable, but the dimension of the space drops by 
one. In Case 4, for example, the equations of plane unsteady motion assume 
the same form, in an inertial frame, as the equations of equilibrium in a three- 
dimensional flat space. 

The equations of equilibrium of a shell having first and second fundamental 
forms a and Bb, respectively, are of the form® 


S°5+b,587°+F =0, 

See be, 5 k=O, 

M* +b, M”°+¢,,S’°+L=0, 

MM’? 5— a’? b,3 M° + a’° eg, S°+L’ =0, 
where the comma denotes covariant differentiation based upon the surface 
metric a, where the indices have the range 1, 2, and where ¢,,=+ |/aé,5, &5 
being the permutation symbol such that ¢,,=+1. F° and F are the tangential 
and normal extrinsic forces, L® and L the corresponding couples; S”® and S® 


are the membrane stress and cross-force resultants, M”® and M° the corresponding 
couples. Only in special cases do (3.9) reduce to the form (2.1). 


Case 6. Equilibrium of an internally free membrane. In all classical studies 
of shells, it is assumed that L=0 and M*®=o. If in addition we have S°=0, 
L’=0, and M’°®=0, (3.9)4 is satisfied identically, (3.9). and (3.9), reduce to 


SS 2 ees (3.10) 
while (3.9), becomes an algebraic equation relating S’° and F: 
br ohare Li == 0: (3.11) 


A tensor S satisfying (3.10) and (3.11) is said to describe a state of membrane 
stress upon the surface whose fundamental forms are a and b. When F 10; 
(3.10) is of the form (2.4). If (3.10) is solved, substitution of the result into 


5 However, it would be permissible to use an invariant formulation throughout, 
since results of Touprn show that the laws of classical mechanics may be expressed 
as tensorial equations in an affine space-time such that the affine connection vanishes 
in all inertial frames. See § 4 of his World invariant kinematics, Arch. Rational Mech. 
Anal. 1, 181—211 (1958). We emphasize that neither his treatment nor ours pre- 
supposes a four-dimensional metric or makes any commitment in regard to relativity. 

6 See, e.g., §26 of J. L. ErtcKsen & C. TRUESDELL: Exact theory of stress and 
stvain in vods and shells. Arch. Rational Mech. Anal. 1, 295—323 (1958). 
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(3.11) yields a differential equation to be satisfied by the stress function or 
potential. Solution of (3.10) by itself constitutes an intrinsic problem ; when 
(3.11) is taken into account as well, the problem is no longer an intrinsic one. 


Part I. Flat spaces 


“ é k a 

4. General solution for a flat space of n dimensions. In order that T ie 0 

in a Euclidean space of any number of dimensions, application of the classical 
theorem of the vector potential shows it to be necessary and sufficient that? 


ToC epee where 0°”? = — b*?™. (4.1) 
The condition 7*”=7”* may now be written in the form 
(O72 = 07?) pea O., (4.2) 


This condition, in turn, is equivalent to the existence of a tensor € such that 


Or eee (4.3) 
where 
id ee i Be oe Ya (4.4) 
Therefore 
DUP = (cP ne A pean era (4.5) 
so that (3.1) becomes 
Thm at le Bie (4.6) 


where 
permd — Eee Roa a enemy . 


(4.7) 


pekma epee jkema La Whe yeram _ ymarer 


The elegant foregoing derivation, given by Dorn & ScHILD§8, shows that (4.6) 
furnishes the general solution of Cauchy’s laws for equilibrium of an 
internally free body in a flat space of any dimension. 


” As observed by GwyTHER [1913], for a stress tensor which is not symmetric 
the analysis breaks off at this point. In a more general system of mechanics initiated 
by Vorcr and developed by E. & F. CossErat, not only is the stress tensor not 
generally symmetric, but also there is a couple stress tensor in addition to the usual 
one. In this system of mechanics, all equations of equilibrium are prescriptions of 
divergences. Stress functions may be introduced by the procedure given above; 
cf. GUNTHER [1958, 2, § 3]. 

8 (1956, 2]. The basic idea was suggested by BELTRAMI [1892, 2]. Cf. also MorERA 
[1892, 3]. 

A variant of this derivation had been given earlier by GUNTHER [1954, 1, § 1]. 
He begins by introducing the skew-symmetric dual tensor of fourth order, 


(*) Limpg= Cnmengee os 


which he interprets as a ‘‘transversal stress tensor’. An explicit solution for Tin p¢ 
in terms of stress functions is simply obtained. In Dorn & ScHILD’s proof, the duals 
appear in (5.1). While GinTHER’s solution for the dual tensor is indeed valid, as he 
says, in a flat space of any dimension, to derive from it the ordinary stress tensor 
we must use the inverse of (*) and hence presume the number of dimensions to be 
three. Of course GUNTHER’s proof can be adjusted to the »-dimensional case also, 
but Dorn & ScuiLn’s proof is equally simple and natural in all cases. 
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To infer (4.7), the theorem of the vector potential has been applied twice, 
viz., to (4.1) and to (4.2). From writings on the theory of the potential® may 
be inferred the following theorem of completeness: Let Z be a regular region} 
with boundary &. In J, let the components T*” be twice continuously differentiable 
functions satisfying (2.1), and in D1, once continuously differentiable. If D 
is infinite, assume that T*™=O(r*-4) and T*™,—O(r-*-*), d>0. Then 
there exist infinitely many tensors h?*™? such that T*™ may be expressed in the 
form (4.6). 

The conditions stated are merely sufficient for completeness and are by no 
means the weakest possible !. 

From (4.6) it is clear that the tensor h?*” is indeterminate to within a tensor 
o?*"4 such that oh?*”"2,,=0. We shall not take up the general problem of 
finding conditions sufficient to individualize a particular tensor within this class, 
though we shall allude to special cases below. 


5. Three-dimensional flat space. In the three-dimensional case, set 


== i! 
ays = a rpk sqm , ( : 


pkmq __ ,krp ,.msq pee 
h ae e Gys5 ays = Asy- ( 


perma 


as 
— 
— 


so that 


Wat 
AS 


Then (4.6) becomes the Gwyther-Finzi general solution ®: 


k k 
Iie a i (5.3) 


® The result is not to be read off from any work I have seen, but a proof may be 
constructed by use of the apparatus assembled to prove the ordinary theorem of the 
vector potential. C/., e.g., § 83 of R. S. Puiriies: Vector Analysis, New York, Wiley 
1933 (the method used in § 49 yields only local completeness). More detailed consider- 
ation is given to the problem by L. LIcHTENSTEIN, §§ 12—14 of Chapter III of 
Grundlagen dey Hydvomechanik, Berlin, Springer, 1929. In these treatments, the 
potentials are rendered unique by requiring them to be solenoidal, but this is not 
convenient here. 

10 Regular regions are defined in §§ 8—9 of Ch. IV of O. D. KELLOGG: Foundations 
of Potential Theory, Berlin, Springer, 1929. Such regions need not be bounded or 
simply connected, and their bounding surfaces may have corners and edges, subject 
to specified restrictions. 

JT do not attempt to obtain in the present case a weakening of hypotheses so 
as to allow certain discontinuities in the components 7*” and their derivatives 
corresponding to LICHTENSTEIN’s treatment of the ordinary theorem of the vector 
potential, because it seems preferable to base a more general analysis on the concepts 
of H. WeyL: The method of orthogonal projection in potential theory, Duke Math. J. 
7, 411—444 (1940), but this requires a whole new program from the start. Further- 
more, general discontinuities in T*” are not of interest, since the integral conservation 
laws to which (2.1) are equivalent for continuously differentiable fields T*” imply 
restrictions upon the discontinuities allowable. A truly general treatment should be 
based upon the integral conservation laws throughout. 

12 GwyTHER [1912] obtained (5.3) in orthogonal curvilinear co-ordinates, writing 
out the special cases appropriate to rectangular Cartesian, cylindrical polar, and 
spherical polar co-ordinates (cf. also [1911]). His steps are such as to imply the 
necessity of the result; the sufficiency is immediate. B. Finzi [1934, 2, § 3] observed 
that (5.3) yields a symmetric tensor satisfying T*” ,,=0; for a proof of completeness 
he was content to refer to the previously known fact that the special cases (5.5) 
and (5.6) are complete. The Cartesian tensor form of (5.3) is almost evident from 
an equation of Kien & WirGHaRDT [1905, Eq. (33)], but they did not obtain it. 


8 GALRUESDEEL: 


Finzi noticed that the tensor @ is indeterminate} to within an arbitrary 
symmetric tensor 9@ satisfying chr? e"*4 oa, . 4g=0- From a known result concerning 
the conditions of compatibility, such a tensor is of the form 0% m= m,1)> where 
b is an arbitrary vector. For a given a, in rectangular Cartesian co-ordinates, 
we may choose b so as to satisfy one or the other of the conditions 


UG ih = nent = m (5.4) 


On, m = — %mm  (ansummed). 


These two choices of b show that for a particular rectangular Cartesian co-ordinate 
system there is no loss in generality in asuming in the first place that a is diagonal, 
or that the diagonal components of @ are zero. The former alternative yields 


Tar aes Tee Ole, etc., (5.5) 
with ai=a,,, V=Ayy, a°=a,,; the latter alternative yields 
Pon Dats ye Tea (ara a ele meter (5.6) 


with a4=4d)3, @°=43,, a°=a,. These two forms of the general solution were 
obtained by MAXWELL and MorERA™, respectively. As follows from the special 
choices of a made to derive them, these special forms are not invariant under 
transformations even of rectangular Cartesian co-ordinates. The explicit form 
for (5.3), with no restrictions on the six potentials, may be obtained by adding 
together the right-hand sides of (5.5) and (5.6). Other special choices of the 
potentials are possible’, but it by no means follows that a solution obtained by 
imposing three arbitrary conditions on the six potentials @,,, remains complete?®. 


18 This fact is used by PERETTI [1949, 2] to show that it is possible to choose a 
in such a way that from its components may be obtained simple expressions for the 
resultant force and moment of the stresses on a surface. Cf. also BLOKH [1950, 1]. 
GUNTHER [1954, 1, § 3] gives simple expressions for the resultant force and torque 
on a body in terms of integrals of stress functions around particular curves. SCHAEFER 
[1955, 3] discusses the nature of ja. 

14 11868] [1869]; [1892, 1]. Using results given by BELTRAMI [1892, 2], MorERA 
[1892, 3] modified his derivation so as to yield (5.5) alternatively to (5.6). Cf. also 
GwyTHER [1913]. A literature devoted mainly to rediscovery of known results 
regarding this subject has arisen recently; cf. Kuzmin [1945], WEBER [1948], Mort- 
NAGA & NONo [1950, 3], SCHAEFER [1953, 5], LANGHAAR & STIPPES [1954, 1], OrN- 
STEIN [1954, 2]. 

Cf. Morinaca & N6éno [1950, 3, § 3]. BLoKkH [1950, 1] lists the essentially 
different forms that result from such special choices: 5 in rectangular Cartesian 
co-ordinates, 20 in general co-ordinates, 18 in cylindrical co-ordinates, 10 in cylindrical 
co-ordinates for rotationally symmetric problems, 19 in spherical co-ordinates. 

** What reductions are possible is not obvious. In writings on stress functions 
there is a deplorable custom of inferring completeness by merely counting the number 
of arbitrary functions. Apart from the logical gap in such inference, its danger is 
illustrated by the solution written down without proof of completeness by PRATELLI 


1953, 4]: km —_ ok ! > 
[ 7 : Tf Mom GhP 4 ors (Er ead nee, alo eg Op (A) 
While indeed a solution for any choice of the three arbitrary potentials F, H, Kk, 
it 1s not general. In fact, by using the expression for the product e#?2 "7s as a determi- 
nant of },’s, we may put (A) into the form 
Thm — P a4 gh JB) km. (B) 


where P=F = H-+K, and it is easy to exhibit solutions of 7*™ m= 0 which cannot 
be expressed in the form (B). 
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While Airy’s stress function for steady plane motion subject to plane stress 
is formally a special case of the foregoing, a treatment which is fully two-di- 
mensional from the start is preferable. I do not develop it here because the 
existing literature is adequate!’, 


6. Application to the axially symmetric case. If we write out (5.3) explicitly 
in cylindrical polar co-ordinates, at the same time supposing that all derivatives 


with respect to the azimuth angle are zero, for the physical components jk of T 
we obtain 18 


BRS W yy FI ay ays 

, yaa? Faro 

(6.1) 
tii ja? a® 1A Wee 
s A i ae 

1 
ro =\a4, 1 gta’ ; 

> VY line 
i: 4 ars dees 6 2 6 
O2=—@,,— 7 ay We a + Q ay s 7 Qn 


where commas denote partial derivatives, and where we have set a’=a,,, 
G'==d,,11,4 =, 0 =4,)7, a =4,,. a =a,,|r. The potentials a7, a”, 2°, anda’ 
occur only in the first four members of (6.1); the potentials a* and a’®, only in 
the last two. Axially symmetric stress distributions in which v9=0, 0z=0 are 
often called torstonless; the most general stress of this kind is obtained by setting 
a*=0, a°=0 in (6.1). In any case, the six potentials may be reduced to three 
in a variety of ways ?*. For example, if we set 


4 
| Beep ose) as 


ie , 


ee? 8 5 
Mes a. ae Gea Le, 


W Discovery: AIRY [1863]. 

Assertion of completeness: MAXWELL [1870, pp. 192—193]. 

First fully satisfactory treatment, including intrinsic forms and multi-valuedness 
in multiply connected regions: MICHELL [1900, 1]. 

Adjustment to steady flow subject to hydrostatic pressure: E. R. NEUMANN 
[1907, 1]. 

Interpretation in terms of resultant torque: PHILLIPS [1934, 4], SOBRERO [1935]. 

General curvilinear co-ordinates: B. Finzi [1934, 2, § 1]. 

Energetic interpretation: L. Finzi [1956, 3, § 6]. 

Other references: BRAHTZ [1934, 1], BaTEMAN [1936] [1938], Crocco [1950, 2]. 

The completeness theorem for Arry’s function does not follow as a special case 
of our theorem in § 4, since a plane stress field regarded from a three-dimensional 
viewpoint does not vanish at co. Completeness is easily established directly, however. 

SCHAEFER [1956, 4] approaches the plane problem as the limit of a three-dimen- 
sional one. There result, in addition to Arry’s, two stress functions representing 
surface loads. 

18 BRDICKA [1957, 1, § 6]. A more symmetrical expression is given by MARGUERRE 
(1955, 2], but his potentials are connected by a condition of compatibility, and there 
is no proof of completeness. 

19 Cf. BLOKH [1950, 1]. 
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then the first four members of (6.1) become”? 


fp = Po (7 Dyk 
Vimy pie oe (7M) grt ke. (6.3) 


i 1 = 
fi=L,,+oL,, f=—L,,. 


The function L is Love’s stress function for torsionless axially symmetric stress 
fields. Similarly, if we put 


Wa? laa a, (6.4) 
: - 
the last two members of (6.1) become” 
(0 We ee (6.5) 
if 2 if z 


The function W is Vorct’s stress function for purely torsional stress fields. 


7. Application to unsteady motion subject to plane stress. We now employ 
the device explained under Case 4 in §3, which rests upon the observation 
that the equations of plane unsteady motion subject to plane stress can be cast 
into the form of the equations of equilibrium of a three-dimensional body, subject 
to a stress T*” related to the plane stress f° as follows: T*?=i** — 0x x, 
T?*=T**—— 9x", T??=— o, where Greek indices, have the range 1,2. Dias 
identification is possible in rectangular Cartesian inertial co-ordinate systems. 
The solution (5.3) is then valid for J’ and, in these co-ordinates, is general. In 
writing out the result, we distinguish explicitly all time differentiations and 
time components. The result, derived in a special co-ordinate system, turns 
out to be an equation having tensorial form under general time-independent 
co-ordinate transformations in the plane, v2. 


= Oe [33 = Cae Cee ae ow? 
EY ae GPO LS RO OE 
Qi = TI = 0 "(aso y— Aso,oy) > (7.1) 
ya sy eA ry d  yp LAD ” 2 rn , 
t OM KO TSP OY (des Cy oy) (Ce he 6) ase o. 


where a prime denotes d/0¢. In the steady case, this reduces to AIRy’s solution, 
— 43, being Atry’s function A. The six potentials may be reduced to three in 
various ways. For example, if we choose a to be diagonal ina particular rectangular 
Cartesian co-ordinate system, we obtain 22 


OSC yy Hea wnlOmaaren lOvenene 
oe 2 +9 
bey — OR = —A yy Oy, tyy — 09 = Wy, tains (7.2) 
tyy— QXY=A yy 


generalizing Arry’s solution to the case of arbitrary plane motion. 


Ny ‘This solution, whose completeness is easy to prove also directly from the 
equations of equilibrium, was obtained by Love [1906, § 188]. Variants are given 
by BRDIéKA [1957, 1, § 4]. f 

a An equivalent result in rectangular Cartesian co-ordinates was given by VoIcT 
[1883, pp. 297-298]. Cf. also MicHELL [1900, 2, p. 133], PHILLIPs [1934, 3]. 


ra ae but not obviously identical solution is obtained by KILCHEVSKt 
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There is literature** concerning the lineal case, when tzy=0, y=0, and ¢,, 
does not appear in the basic equations; to obtain the results, put A=a’=0. 


8. Unsteady motion in three dimensions. For a Euclidean space of m dimen- 
sions, we have the solution (4.6), the completeness of which has been established. 
When n=4, letting Greek capital indices have the range 1, 2, 3, 4, we may put 


Ayszov=tlarsa Cazowk (8.1) 
so that 


flrA4® — GeO AE IVAN Ago (8.2) 
From (4.6) it follows that 4 


ihn = nee (Aa? Axo ¥9,A5) (8.3) 
where (4.7) implies the following conditions of symmetry for A: 


Axsowna=— Aoxsyo=—Axzooyv, (8.4) 


Ayowa =Ayoso- 


Inspection of (8.3) shows that only the second of these sets of symmetry conditions 
is essential; the first set may be abandoned without impairing the solution. The 
tensor A is indeterminate to within a tensor ,A such that e74* 47 "9 Ay wo ay: 
The most general such tensor is a linear combination of tensors of the type 
Bsow,g; to satisfy the essential symmetry condition (8.4); we may choose 
Byov,o+ Byes, o=0; i, finally, we choose to satisfy also the conditions (8.4); 2, 


we have 


ASewo = 4 Bry o) [W, 2] a 4 Biya) [Z, D]> 
= Bsowa— Bsoow— Bosvat Bosaywt (8.5) 
aS Byoxr,o— Bygo,s— Bows, o = Bowo,s: 


To adapt this general solution for equilibrium in a flat four-dimensional 
space to unsteady motion in three-dimensional space, we proceed just as in 
§ 7, except that we use (3.6)—(3.8). Writing explicitly all time components 
and time differentions, we find that our result, derived in a special co-ordinate 
system, turns out to be in tensorial form under time-independent transformations 
of the space co-ordinates alone. These formulae, valid for all inertial curvilinear 


23 The first step was taken by EuLER [1757, §§ 48—49]; the result was worked 
out by W. KircHHorF [1930, 2, § 1] after being suggested by E. R. NEUMANN [1907, 
§ 6]; it has been rediscovered by McVir1rTiE [1953, 3, § 3]. 

24 B. Finzi [1934, 2, § 5] wrote down (8.3) and symmetry conditions consisting 
in (8.4) and a further requirement which I do not verify; he was content to infer 
completeness by counting the number of assignable arbitrary functions. A somewhat 
involved proof was given by MorINaGAa & NO6no [1950, 3, § 4]; I do not follow the 
argument whereby they claim [zbid. § 5] to establish the alternative form 


TIA Be ay A oA Ys 


they give corresponding results in 7 dimensions. 
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co-ordinate systems, are”? 
Smn Y 
=—~¢=— i Ege Pi Weeden cise 
. k ’ : 
ox*=T"4 ae, $0 PUL CA ota pat Aig pik a) 


(8.6) 


ah 2(e%P 4 ems” + a er ages Aanpast PD A ae 
where a prime denotes 0/0¢, and where the symmetries of the tensors A pqmn Agog 
and A4,4, may be read off from (8.4). This is Finzi’s general solution of the 
equations of balance of mass and momentum in an inertial frame. In the case 
of equilibrium, this solution reduces to (5.3) with 4Agyan=4pm- 

Ina particular co-ordinate system, by means of (8.5) we may impose 14 con- 
ditions upon the 20 independent potentials occurring in the solution (8.6). For 
example, we are tempted to take Aq,4,, aS diagonal, A4,,,, as zero, anid A ae 
as zero when m=-g and nr. I have been unable to prove that it is possible 
to choose B in (8.5) in such a way as to justify this special choice of A; if it is 
legitimate, then, writing A7’=4A4441,-.-, A*=2Aeg03,---, in this case we 
reduce (8.3) to the form 

4 


—9 = At, pt Aryy t+ Ares, 0% =Ar gt, --- 


; Rae (8.7) 
1 0k =A AL A ern try —0*V=—A?,y, Ton 


extending MAXWELL’s formulae (8.5) so as to yield a simple yet general solution 
in terms of six potentials. 


9. Status of the problem for flat spaces. The foregoing sections show that 
the general problem is solved in all detail for flat spaces of any dimension. It 
is to be hoped that this exposition may save the labor of rediscovery for those 
interested in the subject, enabling them to proceed at once to applications. 

When theories of materials were first proposed in the eigtheenth century, 
solutions in arbitrary functions such as those presented above were sought 
earnestly, but, for the most part, sought in vain. In the nineteenth century, 
researches on partial differential equations turned away from such general 
solutions so as to concentrate upon boundary-value problems. When, in the 
twentieth century, the general solutions were at last obtained, slight attention 
was paid to them, and to this day they remain virtually unknown. Though 
scant use has been made of them so far, they may be enlightening for studies 
of underdetermined systems, where the conventional viewpoint of partial differ- 
ential equations has gained little. 


» B. Finzi [1934, 2, § 6]. In rectangular Cartesian co-ordinates, this result is 
rediscovered by ARZHANIKH [1952,1] (while he uses 21 potentials, obviously one 
may be eliminated). KiLcHEvski [1953, 1] observes that if Rl, is the Ricci tensor 
based on the Riemannian metric tensor Gp, then in any Riemannian 4-space the 
quantities T74 = RT4_7GT4R®, satisfy T!4 ,=0. Putting Gry =d6p4+ eHyy, he 
calculates T74= eQ?4 + O(¢); hence follows 6 Q/4/é x4 = 0, so that QF4, in rectangular 
Cartesian co-ordinates, gives a solution of the type presented in the text above. 
A similar approach, involving a detour through relativity theory, is presented by 
McVitTIe (1953, 3, § 2]; that his solution is not general is remarked by WuHITHAM 
[1954, 3], who obtains what appears to be a special case of Frnzr’s solution in a special 
co-ordinate system. Rediscoveries of other special cases are made by M1LNE-THomMsoNn 
11957, 3] and by BLanKFIELD & McVirtte (1959, 1& 2]. 
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Application to the simpler theories of special materials is more difficult than 
might at first appear. The additional conditions imposed upon the stress functions 
by particular constitutive equations usually turn out to be so complicated as 
to baffle attempts to satisfy them. Consider, for example, the condition of plane 
isochoric irrotational flow subject to hydrostatic pressure. All fields of velocity 
and pressure of this class are included among those given by (7.1). The simple 
conditions *”,=0 and %,, s5;=0 when applied to (7.1) yield a complicated non- 
linear system of equations to be satisfied by the stress functions As, and a3,; 
the classical formulation in terms of velocity-potential and stream-function is 
preferable in every way. In general, the more special conditions are imposed, the 
less practical is a solution based upon use of stress functions of the second kind. 

A more promising application, initiated by FILONENKO-BoropIcH”® for the 
case of a rectangular parallelepiped, consists in determining the most general 
state of stress consistent with assigned values of the stress vector upon a certain 
boundary. Such results can lead to valuable comparisons, estimates, and mean 
values by which the results of different theories of materials, or of all possible 
theories, are compared. Cf. the remarks at the end of § 1. 


Part II. Curved spaces 
10. Formal intrinsic solution in an affine space. Ina flat space, the similarity 
in form between the conditions of compatibility and the general solutions (5.4) 
and (5.5), or (5.3), has been remarked for half a century?’. This similarity may 
be used to yield a direct solution?® of (2.1) based upon the classical principle 
of virtual work. Indeed, we shall need only a special case. If 7*"=7”*, for 
any vector c, in an m-dimensional space we have 


JT cama =$ TH" ody — f Te crave (10.1) 


26 (4951, 1&2] [1957, 2]. The work rests on trigonometric series or special 
functional forms. 

2? Specifically, the tensor stress function is indeterminant to within a tensor 
satisfying the conditions of compatibility. A similar observation formed the basis 
from which B. Finzi [1934, 2, §§ 4, 7] conjectured his stress functions for spaces of 
constant curvature. See $12, below. It follows from the results we are about to 
present, however, that this method of conjecture is valid only when the compatibility 
operator is self-adjoint, as is the case in flat spaces and in spaces of constant curvature. 

28 The method was given by TRUESDELL [1957, 5] for the two-dimensional case, 
revising work of L. Fryzi [1956, 3]. Earlier SCHAEFER [1953, 5, § 4] had introduced 
multipliers in just the same way, concluding that ,, Jeder Vertraglichkeitsbedingung 
ist eine Spannungsfunktion zugeordnet,“ but his presentation employs results of a 
kind valid only in flat spaces, and he did not mention any further possibilities. 
GUNTHER [1954, 1, § 2] in effect noted the method and remarked that the tensor 
of stress functions in a three-dimensional flat space may be interpreted as Lagrangian 
multipliers expressing the reactions against the geometrical constraints but concluded 
that ‘“‘no new point of view results’’. 

Successful treatment of the converse problem is older. As was observed by 
LocaTELLi [1940, 1 & 2] for a flat space and more generally by L. Frnz1 [1956, 3, § 10], 
if the general solution of the equations of equilibrium in terms of stress functions is 
known, the form of the conditions of compatibility may be derived from the converse 
of the principle of virtual work, which in an elastic context is named after MENABREA 
or CASTIGLIANO. It was on this basis that L. Fuyzi correctly conjectured for mem- 
branes the forms of solution presented in § 13, below. 
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This identity, being based only upon Green’s theorem, is valid and invariant 
in any space where covariant differentiation is defined. For a fixed region V, 
it follows from (10.1) that @ symmetric tensor T*™ satisfies T*™ ,=0 in V of and 


only af 
[ME od pa (10.2) 
V 


for all tensors Ay», such that the system 
Lim = CR, m) (10.3) 


has a solution c, satisfying the condition T*"¢, da,,=0 upon S. Since we are 
interested in satisfying the differential equations everywhere, we may adjust 
the region so that the boundary condition is satisfied*®; in effect, we need only 
consider the interior condition ®° (10.3). In other words, the variational condition 
(10.2) for all d,,, such that the system (10.3) is compatible is equivalent to the 
differential equation 7*” ,,=0, provided SM hia 

Let it be supposed that the conditions of compatibility for (10.3), in the 
space considered, are of the form 


q 


ah Pq par 
= Kak! dpa + Bizni d Aggy 
pars t 
a age) Tnarst nar dp grst + 
wee 


0 = Zi541(d), 


(10.4) 


where the sum is finite. By a standard device, this system of side conditions 
is taken into account by use of multipliers P‘’*’, so that the restricted varational 
condition (10.2) is replaced by the modified condition 


SLE dam — POY Fijaild)] dv=0 (10.5) 
for unrestricted d. By applying Green’s theorem, we put (10.5) into the form 
J [Di — Pm Py dyn dot $-—, (10.6) 

Ss 


where the dots stand for a surface integral not affecting the result we seek, 
and where ¥ is the operator adjoint to &: 


cpkm = km prstu m ystu mqv stu 
L (P) = ‘y stu Yeh Be es tO rae nea soll co | rr occ aoe (10.7) 
Since (10.6) is to hold for arbitrary d,,,, it follows that 


Le Gael Pye (10.8) 


a Cf. also the argument used by Dorn & ScHILD [1956, 2]. 

fbb cis worth noticing that from (10.1) there follows another characterization 
which 1s not variational, as follows: For a given symmetric T*™ such that T*™ , is 
een tinuous: let the system (10.3) be such that in any neighborhood of P there exists 
a region V with boundary S such that (10.3) admits 2 linearly independent solutions 
cz, Which vanish upon S, Then 7* ™ m= Oat P if and only if (10.2) holds for all such V. 
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The condition of symmetry (2.1), has not been considered explicitly, but 
it is obviously satisfied because the tensors a, B,... occurring in (10.4) may be 
taken as symmetric in and g without loss of generality, so that f*"=G"", 
Thus the result (10.8) always yields a symmetric T. Conversely, the necessity 
of (10.8) follows from (10.2), and this in turn is equivalent to (2.1), only if T 
is assumed to be symmetric. 

Thus our result (10.8) is the general solution of the equations of motion (2.1) 
in an affine n-dimensional space. The problem of solving (2.1) is thereby reduced 
to the problem of finding the explicit form (10.4) for the conditions of compati- 
bility of the differential system (10.3), in the particular space considered. 

When we attempt to phrase the result as a rigorous theorem subject to 
precise conditions of regularity, we run up against an unexpected difficulty. 
While the use of multipliers to eliminate constraints which are partial differential 
equations goes back to LAGRANGE, is standard practice in continuum mechanics, 
and has been used without comment by at least one eminent pure mathematician *!, 
the modern literature seems to be absolutely silent regarding this subject. A 
straightforward attack reduces the problem to one of existence of solution of 
(10.8), regarded as a partial differential equation satisfied by P when T is given. 
However, there are indications that the entire approach through the principle 
of virtual work ought properly to be regarded in terms of a principle of invariance. 
Such a principle will not be sought here; for the present, we recognize that the 
solution (10.8) is to be regarded as formal. 


11. The form of the conditions of compatibility in a Riemannian space. 
In the previous section, the general problem of solving the system (2.1), in an 
affine space, has been reduced to that of calculating explicitly the conditions 
of compatibility for the system (10.3) in the same space. For completeness, we 
indicate the nature of this problem of differential elimination and summarize 
the general information concerning it available at present. 

Our problem is to eliminate c, between (10.3) and its first p derivatives, 
for some finite #, where 


0c 
Cem = am — Lim Cp: ey les |) 


Regard the field c, as given, and let d,,, be defined by (10.3); put W; m= Cty, m]- 
For a symmetric connection I we have the identities 
De py pal Ons po Op pien 0 5 
Cen pare enna Cot bab (41.2) 
Vp — Vigne gle ig ps a gmk pe 
Since Cy mg=4im,p + Lam, p» DY forming Cy mp — Cx, pm and using (11.2), » we find 


that 
Wp tap — one, ee (3) 


31. HELLINGER, §§ 3d and 7e of: Die allgemeinen Ansdtze der Mechanik der 
Kontinua. Enz. Math. Wiss. IV 2.2, H. 5, 601—694 (1913): ,,so kann man nach 
dem bekannten Kalkiil der Variationsrechnung ... zugehorige Lagrangesche Faktoren 


“e 


Aon Gabaniblovmesth ooneeg 
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Now forming Wy, 4;— @mp,sh and using (11.2)3, we obtain the identity® 


dem, bs ‘ad dy »,ms AS, Da pe Gp des we = 
oe (Le eee a RA ee) Cq = Ri mp qh ee Ri mp das — (11.4) 
a Le Was als Te ee Wop, ci IN Fine Wom a. Ro Wop = 0. 
For a flat space, (11.4) reduces to the Kirchhoff-St. Venant conditions 
din ps “bp. ne em pet Cehk (11.5) 


In more general spaces, we are to derive from (11.4) and from the geometry 
of the space further identities, by means of which c, and w,,, are to be eliminated. 

PALATINI23 has indicated how the calculation can be initiated in the case 
of a metric space. First, we replace sums of the type R’... a, by corresponding 
sums R,... a7, then use the relation R,,, ps=Rosem and the Bianchi identities 
so as to obtain (R%,ms,~—R%mp,s) a= —Rmpsk,ge* Thus (41.4) becomes 


t q q 
On Ons Grige i Ropinge _— Ry per ee a Ru prq4s “ta 
ar Ri, pal s ae it 


(11.6) 


7 q q) 
psa h = papel msm s ==.0. 


Raising the index k and then contracting upon k and m yields** 
lps er dys s ag 244 p,5)q an 2d" Rs) tn 2wi, Rs)q— Ry sq Reais (11.7) 


where (11.2); has been used, where Ryg= Roan, and where [=d;. Raising the 
index f in (84.10) and then contracting upon g and s yields** 


Ded? ppc Rie pe lie. (11.8) 
where R=Rj. 

Equations (11.6) are to be regarded as a system of $” (m+ 1) non-homogeneous 
linear equations for the 3” (n+4) unknowns c! and w*” in terms of the tensor d 
and its second derivatives. Substituting the solution of these equations into 
(11.6) yields, in principle, a set of differential equations for d alone**. The 
geometrical meaning of the condition of solubility expressed in terms of a 
determinant formed from the components R,, and R,,, is not known; of 
course, it is not satisfied in a flat space, nor is it relevant, since the appropriate 
condition has already been shown to be (41.5). 

More generally, directly from (10.3) we see that the nature of the solution 
depends very strongly upon the geometry of the space considered. In spaces 


EORTCCI MTS SO. Gan(20)iils 

*° (1934, 3]. The method was sufficiently indicated by his earlier analysis of a 
space of constant curvature [1916]. Cf. also ANDRUETTO [1932, 1 and 2], AGOSTINELLI 
[1933], GRAIFF [1958, 1, §§ 6—9]. 

** This identity was given in a special co-ordinate system by PaxaTIni [1934, 3]; 
an equivaient general form is due to Gratrr [1958, 1, Eq. (22) | 

35 GRAIFF [1958, 1, Eq. (23)]. 

36 This seems to be a correct substitute for the method of PALATINI (1934, 3]5 
who notes that it is possible to choose co-ordinates so that at a fixed point (11.7) 
with p=s becomes a system of » linear equations for the components c?% but fails 


to note that the solution of this system is not sufficient, in general, to obtain the 
derivatives of c? and so to determine wk”, 
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admitting a group of “‘motions’’, 7.¢., instantaneously rigid velocity fields, the 
solution of (10.3), if compatible, is determinate only to within such a motion. 
In spaces where instantaneously rigid motions are not possible, the system (10.3) 
will determine € uniquely from a given d, if compatible. Signorina GRAIFF%7 
has initiated a discussion of the problem in terms of the principal invariants of 
the tensor &,,, according as these are linearly independent and non-constant 
or not. The details are complex, and the problem must still be regarded as open. 


In a space of constant curvature, we have 


n(n Eis 1) imp R (Gem Op Sep Ofn) 


11.9 
NR, = i ope 


qkm> 


where R=K=const. The terms involving ¢ and w in (11.6) vanish. The 
resulting conditions, easily seen to be sufficient as well as necessary, are 38 


Y LU R 
Of), Oms (Ay, gu — — d,18qu) =0- (14.10) 


n(n—1). 


When = 2, there is but one linearly independent non-vanishing component of 
(11.10), which may be written in the equivalent forms 


Cred gg KL = O, 


(14.41) 
pe —d** ,+KI=0, 
where K is the total curvature, K= —3R. 

More generally, when »=2 and K is arbitrary we have R,,,,,=K é,g é,5 and 
R,g=—Ka,,, where a@ is the metric tensor. Again the terms containing w in 
(11.6) are annulled, and we have 

oF ed. ap + KI =— 2K ,c*. (11.12) 


Further differentiations are needed to eliminate ec. B. Frnz1°% has shown that 
for a surface applicable upon a surface of revolution the final condition assumes 
the form 


Co RIC dg Ka dg ee Ke dey ay, = 0. (11.13) 


For a general surface, he obtained a system of three conditions of compatibility, 
each being a differential equation of fourth order. I remarked*® that they must 
be equivalent to a single condition of fifth order. By a method of infinitesimal 
variation applied to a complete set of differential invariants of the surface in 
question, Signorina GrairF*! has given a definitive treatment of the problem. 
She has found two identities relating the quantities occurring in B. FInzi’s 
conditions, but she has not effected the elimination explicitly. She has charac- 


SAMOS Sy dense 0) 

38 PaLaTINI [1916], [1934, 3], ANDRUETTO [1932, 2], Finzi [1934, 2] including a 
simplification when 7 = 3. 

2703 OWA 

40 (4957, 6]; the reasoning is presented in § 13, below. 

AA 4057; 31 
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terized the case when the least possible order of the single scalar condition is 4; 
in this case, as for a surface of revolution, the lines A—=const. are geodesic 
parallels, but K°% is not a function of K only. 

Even in the cases when »=3 and n=4, the possibilities are various *#?, and 
the details are too intricate to summarize here. The fullest information now 
available is included in the two papers of Signorina GRAIFF already cited. 


12. Application to spaces of constant curvature. In a space of constant 
curvature, from (41.10) it follows that the coefficients in the form (10.4) have 
the special forms 


a tar 


PY 
Kiikl ~ “a (n—A) uy kl Suv» 


(2.45 
Virke — ovr Of}, 

while all other coefficients vanish. The operator ¥ is self-adjoint, and from 
(10.8) we have the following general solution for a space of constant curvature: 


where we have set 
fpehmd — Of? oma Pe (12.3) 


P being the tensor in terms of which the general solution of § 10 is expressed. 
From (12.3), it is immediately plain that h satisfies the conditions of symmetry 
(4.7)2.3,4- Thus the solution (4.6) for flat spaces is included in (12.2) as the special 
case when k=0. 


When »=3, we may introduce the tensor a dual to h according to (5.1). 
The solution (12.2) now becomes 4% 


km _ ,krp .msq 
Tr: Sea? € (Gp: pas te Aantal (12 4) 
k MS | cm m ‘ 
ad = et? MIG eRe" al —al™), 
generalizing (5.3). 
When »=4, we may introduce the tensor A dual to h according to (8.4) 
and so obtain from (12.2) the solution 44 


TA TAE® AEWO 
Iv“ =e e (Asewo ga— ty KAsawo Seu); (12.5) 


generalizing (8.3). However, this form of the solution does not seem to offer 
any advantage over (12.2). 


13. Application to the classical theory of membranes. We now consider 
the membrane problem: To find the general solution of (3.10), where covariant 
differentiation is based upon a given two-dimensional Riemannian metric @ 


“2 GRAIFF [1958, 1, §§ 13—14]. 
2B BINZI (1934, 2. § 4]. 
“4 B. Finzi [1934, 2, § 7] gives the solution 


ALAS) Dy pA eG) x 
aE é é Axovaagt K(Ayo*® gl4 — 2474) 


this may be equivalent to (12.5) but is not obviously so. 


> 
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and where we take F°=0. By direct and laborious reduction, StorcHI4®> has 
obtained a general solution in geodesic co-ordinates. This solution involves 
derivatives of orders up to 5 of a single stress function. At the present writing, 
a corresponding invariant solution is not yet known. In order to find it by our 
method, we should have to perform explicitly the reduction of B. Frnz1’s con- 
ditions of compatibility to a single scalar equation. 


We rest content with recording the simple cases that follow effortlessly 
from the results already given. When the condition of compatibility is a single 
scalar condition #(d)=0, the analysis proceeds just as in §10, except that 
the four indices 77/1 are suppressed, and the multiplier reduces to a single 
scalar A. 


For a surface of constant curvature, by comparing (11.10) with the reduced 
form of (10.4) we see that 


OOP SIGE. ihe Oe Rene ate (13.1) 


and all other coefficients vanish. Substitution into the reduced form of (10.8) 
ylelds the general solution for surfaces of constant curvature*s: 


TS Pee A KA at, (13.2) 


Of course, this same result follows from (12.2) and the observation that when 
n=2, the most general tensor # having the symmetries (4.7) 3 4 is of the form 
jr*P° ¢#” F° 4 for some scalar A. 


For a surface applicable upon a surface of revolution, by comparing (11.12) 
with the reduced form of (10.4) we see that 
anh AU) GR A GS a 
pares rman y nomi pabe ae (13.3) 


potv T(O .Y)o Jey” 
OP oer 2 Hl oP) S K } 


and all other coefficients vanish. Substitution into the reduced form of (10.8) 
yields the general solution for a surface applicable upon a surface of revolution 


45 [1950, 5]. Srorcur [1950, 4] observed also that if for an arbitrary surface we 
choose co-ordinates x, y so that ds?=A(d%?+ dy?), then a solution of (2.10) when 
F=0 is furnished by the formulae A?S**%¥= c?A/dy?, 22? S*V= — G?Alox dy, BSVI= 
e?A/ex?, provided that 674 /éx%*-+ 6?A/@y2—=0. For such solutions the mean pressure 
vanishes: 4(S**-+ SY”) = S$=0, but it is not shown that all solutions such that 
sg = 0 are included. Srorcui treated the case of a surface of revolution in [1949, 3]; 
in [1952, 2] and [1953, 6], the case when a general solution involving derivatives of 
orders no higher than the fourth is possible. C/. the corresponding condition of 
compatibility mentioned at the end of § 11. A solution for minimal surfaces is initiated 
by CoLonneEtTTI [1956, 1]. I do not attempt to present the solutions, some classical 
and some recent, for special cases defined by conditions of inextensibility. For 
Riemannian spaces of 2, 3, and 4 dimensions, a special solution containing an arbitrary 
function of the total curvature is obtained by STorRcuHI [1957, 4]. 

46 B. Frnzr [1934, 2, § 2] verified that (13.2) satisfies (2.1) when K is constant 
but did not prove the completeness of this solution; his result is rediscovered by 


LANGHAAR [1953, 2]. 
2% 
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of non-constant curvature*”: 
TOO) KER GP Oe Pee ee 
a [aero att see COT Bipier |e ee Keg] Ay+ 
SoBe ee Keres re ee eA 
he een aaa 


(13.4) 


[Note added in proof, September 15, 1959. The elegant paper of GRAIFF [1959, 3] 
on this problem has reached me too late for a full description to be included here. 
Her essential idea is to begin with an invariant decomposition of the three-dimensional 
space of symmetric covariant tensors defined upon the surface. The general case is 
defined as that in which the scalars K and H=K _, K>% are functionally independent. 
Then the three symmetric covariant tensors Kk , K g, H Hg, and H, , Kg) form a 
basis for the symmetric covariant tensors Fy g: 


Fup =AK aK pt BH aK t+ CH He, (13.5) 


where the scalar functions A, B, C are uniquely determined joint invariants of F, Kk, 
and H which are easy to exhibit. After calculation of Fy, g°? it turns out that the 
most general symmetric tensor Fg, such that 


Fp x Ka (13.6) 


corresponds to a special choice of A in (13.5). Now let o be any scalar function, 
and put 
Dog = GaglY, py” +K YP) — Yap; (13.7) 
then 
Pp =O Kg. (13.8) 


Hence the most general solution of (2.1) is of the form 7,,=D,g+@,, where Dy, 
is the most general solution of 


Dap? =— 9K a (13.9) 


for any given g. Matching (13.6) and (13.9) determines a unique value for gy. The 
result is an explicit formula for the general solution of (2.1) in terms of derivatives 
up to fourth order of two scalar potentials. This is a result of the type to be expected 
in view of the conditions of compatibility discussed in § 11. 

However, GrairF infers that either one of the two scalars may always be taken 
as zevo. This contradicts the results of Storcut, cited in footnote 45, according to 
which it is only an exceptional class of surfaces for which fourth derivatives of a 
single scalar suffice. In Gratrr’s work, a solution x to her equation (23), with B’=0 
or (23), with C’=0, for any B and C, respectively, is assumed, but the existence of 
solution to this problem on a curved surface is not proved. ] 


An essentially different approach to the membrane problem has been initiated 
by PucuEr*. He combines (3.10) and (3.11) from the start, so that the intrinsic 
problem is never solved, and he uses special oblique co-ordinates on the surface. 
While a simpler derivation of his results has been given by L. Finzi?9, it does not 
seem easy to put the analysis into invariant form. 


14. Status of the problem for curved spaces. While the powerful method of 
§10 reduces the problem to one of differential elimination, the necessary 


“7 Given in geodesic co-ordinates, with a proof of completeness, by SToRcHI 
(1949, 3]; in the above form, with an imperfect proof of completeness, by L. Frvz1 
[1956, 3]. 

“81934, 5] [1939]. 
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calculations seem to be difficult. For physical interpretation, curved spaces 
are most interesting in two special cases: ordinary surfaces and four-dimensional 
space-time. 

The most useful-curved surfaces are included in the results given in § 13; 
the one further elimination needed for the general surface is known to be possible 
and doubtless will soon be effected. 

No special simplification is apparent, however, when »=4. Furthermore, 
recent studies of the foundations of mechanics show that the most interesting 
result would be that for a not necessarily Riemannian affine space. While Ricc1’s 
identity (11.4) is valid for such a space, none of the further calculations in § 11 
are applicable. Since the problem as stated is an affine one, it seems that the 
entry so far used is not really cogent, and that a more penetrating study of the 
structure of affine spaces is needed. 

Acknowledgment. I am grateful to Professor EricKsEN for assistance in pre- 
paring § 8 and to Professor STERNBERG for criticism of an earlier version. 
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Infinitesimal Plane Strain in a Network 
of Elastic Cords 


S. M. GENENSKY & R. S. RIVLIN 


1. Introduction 


In a previous paper*, the problem has been considered of plane strain in a 
sheet of fabric consisting of a network formed by two families of parallel, in- 
extensible, perfectly flexible cords, which cannot move relative to each other 
at their points of intersection. No restrictions were placed on the magnitude 
of the displacement gradients in the deformed sheet, except insofar as they are 
implied by the inextensibility of the cords. 

In the present paper, we consider a similar problem in the case when the 
cords are extensible and elastic and the displacement gradients are sufficiently 
small so that terms involving the displacement gradients linearly may be neglected 
in comparison with unity, terms of second degree in the displacement gradients 
may be neglected in comparison with those of first degree and so on. 

In Part I, the theory is developed without placing any limitations on the 
magnitude of the deformation undergone by the sheet and equations of equilibrium 
and expressions for the edge tractions are obtained for plane strain of the sheet. 
In Part II the relations obtained in Part I are simplified for the case when the 
displacement gradients are small compared with unity. It is shown (in § 8) how, 
in this case, the displacements throughout the sheet may be obtained when the 
edge displacements are specified. In § 9 it is shown how the displacements through- 
out the sheet may be obtained when the edge tractions are specified. Finally, 
in § 10 it is shown how the displacements throughout the sheet may be obtained 
in certain problems in which the boundary conditions are of the mixed type, 
the edge displacements being specified over part of the boundary and the edge 
tractions over the remainder of the boundary. 


I. General Theory 
2. Kinematic Considerations 
The plane sheet of fabric described in § 1 is considered to undergo a plane 
deformation. We may describe the deformation with reference to a fixed rec- 
tangular Cartesian coordinate system x, the axes x, and x, of which are parallel 
to the bisectors of the angles between the cords in the undeformed state of the 


sheet, and are chosen so that the two families of cords make angles +a with 
the axis x, in the undeformed state of the sheet. 


* Riviin, R. S.: J. Rational Mech. Anal. 4, 951 (1955). 
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If X; and x; (¢? =1, 2)* are the coordinates in the system x of a generic particle 
of the sheet in the undeformed and deformed states respectively, then the defor- 
mation of the sheet is described by relations of the form 


x; = %;(X;), (2A) 


where the indicated functional dependence is single-valued, possesses a unique 
inverse, and is continuous and differentiable as many times as may be required, 
except possibly at isolated points or on isolated lines. Let P and Q be two 
neighboring particles of the sheet and let dS and ds be the distances between 
them in the undeformed and deformed states respectively. Then, 


(dS?) =dX, dX, (2.2) 
and 
(ds)? = dx,dx,. (2.3) 
From (2.1), it follows that 
— 0%; 
Li aX, aX. (2.4) 
Using (2.4), (2.3) becomes Jeg oh 
2s Og Beha 5 
ds) Rs Soe aX, aX,,. (2.5) 


Let L; be the direction-cosines, in the rectangular Cartesian coordinate system ~, 
of the line element PQ in the undeformed state of the sheet. Then, 


eax aS) (2.6) 
With (2.5), we obtain 
ds OX; OX; 
aah SaieKpaays fi Ht (2.7) 


Let e, and e, be the fractional extensions, in the deformed state of the sheet, 
of cords which make angles « and —«, respectively with the x, axis in the un- 
deformed state. Then, taking L;=cos«, sine in (2.7), we obtain 


F) ax; oe 
(4+ 4)?= ae a in a ye cos a + ax, sin a} ; (2.8) 


Similarly, taking L;=cos «, — sin « in (2.7), we obtain 


(4 + 9)? =( 2% cos, — 2% sin a) ( MS ose 


sing]. De 
ax, ons ax, gi a) 22) 


Let Z; denote the coordinates, in an oblique coordinate system, the axes of 
which are parallel to the directions of the two families of cords in the undeformed 
sheet, of a point which is at X; in the system x. We then have 


X,=(Z4,+2Z,)cosa and X,=(2Z,—Z,) sina. (2.10) 
From (2.10), we obtain 
0 . 
== COs 
and of os at (2-44) 
SDs, Bak NOX et 


* Latin subscripts will be considered to take the values 1, 2, throughout this 
paper. 
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Introducing (2.11) into (2.8) and (2.9), we obtain 


Ox, 0%; d pe ae Ox; 
s 4 ¥ 4 | é oa =: — OPS 
a7) tee i Mekal aT 9 Cae 


Let J, be the direction-cosines of the line element PQ in the deformed state 
of the sheet, in the coordinate system x. Then 


boa 04.10 Se (2.13) 


With equations (2.4) and (2.6), we obtain 


OES Ose: 
OREM 2 
Lan Ay Ue ele 


3. Stresses 


We consider next a sheet of fabric subjected to plane strain by the application 
of edge and surface tractions. The components of stress, ¢;;, resulting from this 
deformation, are defined in the following manner; ¢;, and ¢;, are the components 
of the force per unit length in the positive directions of the x, and x, axes re- 
spectively, measured in the deformed state, exerted across an element of length 
at (x, %») normal to the x, axis, by the material on the positive side of the element 
upon the material on the negative side of the element. From the continuity 
of the fabric and the equilibrium of moments, it follows that 


(ae (3.1) 


Let 7; be the components in the coordinate directions of the stress vector, 
measured in the deformed state, acting on an element of length at (%,, x.) with 
unit normal which has direction-cosines ”,; in the system x. Then, 


Lat, 0, (3.2) 


4. The Relation Between Stress and Deformation 


We assume that the sheet of fabric is deformed in accordance with equation 
(2.1) by forces acting in the plane of the sheet. Let t, and t, be the tensions, 
at a generic point P of the sheet, in the cords inclined initially at angles « and —« 
to the x, axis. Let 6, and —f, be the inclinations of these cords to the x, axis 
in the deformed state. 


Since linear elements of the cords of the two families, which have lengths 
dZ, and dZ, respectively in the undeformed state, have lengths (1 +e,) dZ, and 
(1 + é,) dZ, respectively in the deformed state, we have, 


1 OX : 4 Ox 
COS Utes Soci | Sibson ee 
ia NAB Oe, tes sme ey. < 
cos B 1 Ox, O B 1 OX» (4.4) 
y= Tae sin St ee ee 
1+e, OZ, {tab Zen 


These results can be obtained by taking L,, L,=cos«, sin « and 1,, l,=cos B, 
sin B, and by taking L,, L,=cos «, — sina and J,, 1;=cos Bz, —sin B, in equations 
(2.14) and employing the relations (2.11) 
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We denote by d the intercept formed by adjacent cords of one family on a 
cord of the other family in the undeformed state. Then the intercept formed, 
in the deformed state, by adjacent cords at P of the family initially parallel 
to the Z, axis, on the cord through P, initially parallel to the Z, axis, is d(4-+ ¢,). 
The number of cords of the Z, family intersecting the cord of the Z, family per 
unit length in the deformed state is therefore 1/d(1-++e,). The stress vector on 
the Z, cord per unit length is thus t,/d (1+ e,) in a direction parallel to the cords 
of the Z, family, 7.e. in a direction having direction-cosines cos B,, — sin By in 
the coordinate system x. The components of the stress vector in the direction 
of the x, and x, axes are therefore 

ee Pm anda Lees (4.2) 
d(1+€e,) d(1+é,) 
respectively. The normal to the element of the Z, cord considered has direction- 
cosines (sin f,, —cos f,). From equations (3.2) we see that the stress vector 
acting on such an element has components 


z,,Sin B, —4,,cosB, and 4#,.sinf,—#,,.cos p, (4.3) 


in the %, and x, directions respectively. We thus have from (4.2) and (4.3) 


t,, sin By— 4,.c0s B, = EAE Ba. 
: t,2 Sin B,— t,. cos B, = — BS 
12 L 22 1 d(1+e,) . 


In a similar fashion, by considering the stress vector acting on an element 
of the Z, cord through P, we obtain 


i, Sin By + 42 cos By = He 
and : T,S1n 2, (4.5) 
ty Sin By + fy. Cos By = Free,” 
Solving equations (4.4) and (4.5) for 41, f,. and 4,,, we obtain 
bee 1 ( T, COS? By ! Tz COS? Ps) 
11 dsin(B, +B.) \ 1+. eo He 
deaoebith Tsin? B, | T,Sin? Ps) (4.6) 
dsin(B, +B.) \ 1+: 1+é, 
2G pel 1 tT, cos B,sin B, 7, cos PB, sin Be 
om d sin (B, +B) 1+és 1+e& 
Let d be the distance between adjacent cords of each family in the undeformed 
state of the sheet. Then, 7 djsin 20. (4.7) 
Substituting from (4.1) and (4.7) in (4.6), we obtain 
ee sin2a[ tT ( Ox, J T ( 0x4 y 
ae EA |Ae, V eZ, 17h, \ OZ 
a SM Dee || ae OX, \2 T, [OX ‘| 8 
d f= a7 beter az | an rater. (4.8) 
aa “mete sin2a/ 7, 0%, O%, T, 9%, O%, | 
an aA late Dato Pe teen OL OZ, ||” 
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where J is defined by 
O%, O%,  O%, OX, 
‘ AD NEED (4.9) 


5. The Equations of Motion 


The equations of motion for the sheet are 


Ot; 62x. 
4 yi L 


Ox; = ae ee) 


where F, denotes the applied force per unit area, measured in the deformed state, 
and 0 denotes the mass of fabric per unit area, measured in the deformed state. 
We shall limit our analysis to static problems, so that 6?,/¢#—0 and equation 
(5.1) can then be written as 


Ot; 5 OZ 
Bee =O). 22) 
Ee Gk R= 0 (5.2) 
We have 
Oi OZ ee 
Toe ee 5-3) 


Regarding (5.3) as an equation for the determination of 07,/6x;, we obtain the 
solution as 


OZ, 1 OX, OXp \ 
Ce A ee 18 OZ, ), (6-4) 
where A is defined by equation (4.9). 
Introducing (5.4) into (5.2), we obtain 
Ot;; [ OX, OXp 
aZ,, ce Oj 2 Boars (5.5) 


The expressions (4.8) may be introduced into (5.5) and the resulting equations 
simplified to yield 


a) ( T Ox, \ id Un ORG ad AF, 
OZ, ehew eZee bee a sin 2% 
= T OX a) TO ad AF, 

aZ, \4 te us aZ, bane a sin2a 


and 


(5.6) 


If no surface forces act on the sheet, 7.e. H=,=0, equations (5.6) become 


0 (= | 7) | tT. Oxy 136 
OZ, \ione,) OZ, OZ iene oe 

0 | as eae rae es Pas 
Of, Ae, OZ, OZ \ieen a : 


and 


6. The Edge Tractions 
We now consider the plane sheet of fabric to be bounded by a simply-con- 
nected closed contour C, which is everywhere continuous and has a continuously- 
turning tangent except possibly at a finite number of points. We consider that 
the sheet is subjected to edge tractions in its plane, applied to the contour C. 
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Let Q be some reference particle and P a generic particle of the boundary C. 
We denote by 2 and o the distance from Q to P, measured along C in the counter- 
clockwise sense, in the undeformed and deformed states of the sheet respectively. 
We further denote by N, and m; the direction-cosines of the outward-drawn 
normal to C at P in the undeformed and deformed states of the sheet respectively, 
and by M; and m; the direction-cosines of the tangent to C at P in these states. 
It follows immediately that INGEN UN soot (6.1) 


and Ne Ms, Ny =— M,. (6.2) 


Let the components of the edge tractions, per unit length of contour, measured 
in the undeformed and deformed states of the sheet, be £; and &; respectively. 


pen, Pee aa (6.3) 


since dX’ and do are corresponding elements of length on the contour in the 
undeformed and deformed states respectively. 
The components of edge traction ¢; are given in terms of the stress components 


ae by . 
E,= 1,05. (6.4) 
With (6.2), (6.4) yields 
E,=t1m,—t,m, and Ey = thy My — tag My. (6.5) 
From (2.14), we obtain 
G2) Obs 
Ue OX, M,;. (6.6) 


Introducing (6.6) and (6.3) into (6.5), we obtain 


Ox Ox. 
§= (Sea = ts) M, 
I 


and oe! agaees (6.7) 
B =( 2 | Ly 2) M,. 
MC kee 502g Way 2 
Introducing the expressions (4.8) for ¢;; into (6.7), we obtain 
i sin2a]/ % 0%, ( OX, O%— Oxy an) 
HDNG AWN 18 2OZ AN OZ, OX, ACL OG) * 
uy Ce RO, OLE OX» an] M. 
A peeve lez. OX ecient 
and (6.8) 
ee SN Des || sey aes (So 0%, —O*» =| 
GAM Ee OZ, OZ, OX, lO Zy OX) = 
| Tt, 9%, (a OX OX men M.. 
i 4+e, 0Z,\0Z, OX; 2, OX; ] 
With (2.11) and (4.9), equations (6.8) yield 
Sy h yl a aieei = T  % (Mf, cosa +M sin a)| 
Ey ee ae ee NESS ree aZ, ‘ P + M, ) 
and (6.9) 
eee ey = 2 (M, cosa + M, sina i 
E, alta eZ, (M, cos « HES ea aZ, ‘ 2 + M, ) 


3% 
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II. Infinitesimal Deformations 
7. Development of Basic Equations 


Let u,; be the components in the coordinate system * of the displacement 
dndereone in the deformation by a generic particle of the sheet. Then, we have 


4, = X;,+4;. (7.1) 


We shall assume that the deformation is sufficiently small so that terms of the 
second degree in the displacement gradients 0u;/0X; may be neglected in compari- 
son with those of the first degree. From (2.11), it is apparent that we may neglect 
terms of the second degree in 0u,/@Z,; in comparison with those of the first degree. 
It is also apparent that we may neglect terms of the second degree in e; in com- 
parison with those of first degree. 

With this approximation, we can write equations (2.12) as 


1 Uu 
OZ. oZ. 
and se s (7.2) 
COS & on sin « ce ies é 

Ova aZ, a 


We shall assume that the fractional extensions e, and e, in the cords of the 
two families are related to the tensions t, and tT, in them by the formulae 


t=Ré, and “te he, (7.3) 
where & is a constant. 
Employing the relations (7.1) and (7.3) in equations (5.7) and neglecting 
terms of the second degree in ¢, e, and du,;/0Z;, we obtain the equations of 
equilibrium, in the absence of surface forces as, 


ey Oey &*. 
4 OZ, TZ 2 

Oe, Oe, 0 a 

Of. 02... tae 
From (7.4), 

ee ae 

Tae eV : (7.5) 
so that 

&=%(Z)) and e=e,(Z;); (7.0) 


2.e. the fractional extension—and hence the tension—is constant along each cord 
of the sheet, but may vary from cord to cord. Bearing this in mind, we now 
integrate equations (7.2) to obtain 


and My COSH + Ugsina =Z, €,(Z2) + p,(Zp) 
M COS% — Uy SiN a = Z,,(Z,) + $2(Z,), Fazy 


where #,(Z,) and £,(Z,) are arbitrary functions of their arguments. From (7.7) 
we obtain ts 


2U, COS% = Z, &(Z) + Zs €s(Z)) + p1(Z) + P2(Z;) 
2u,sin % = Z, €,(Z,) — £2€,(2Z;) + £1(Z,) — p2(Z,). 


cane (7.8) 
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Again, employing the relations (7.1) and (7.3) in equations (4.8) and (4.9) 
and making the approximations employed above, we obtain the following expres- 
sions for the stress components ¢,;: 


k cos? a Rk sin2 
hi= d (, + 9), tog = Fi = (€, + é9) 
and : (7.9) 
cos «sin % 
he=by= FRE (€, — 2). 


In a similar manner, we obtain, from equations (6.9), the following expressions 
for the edge tractions &;: 


= : = (a + €y) M, cos a — (€, — é,) M, sin ox | 
— Rk sin (7.10) 
52 d = [(¢1 — &) M, cos a — (€ + é9) M, sina]. 


8. Solution of the Problem when Edge Displacements are Specified 


We consider a sheet which in the undeformed state is bounded by a simply- 
connected closed countour C which is everywhere continuous and has a contin- 
uously-turning tangent, except possi- A) 
bly at a finite number of points, as 
shown in Fig.1. Let P be an interior 
point of the sheet with coordinates 
(Z,, Z,) in the oblique system formed 
by two intersecting cords. Two cords 
pass through P cutting C at four dis- 
tinct point Q, Rk, S and T, which have 
coordinates (a,,Z,), (Z,, 4), (b,,2Z2) @lar,2Z2) 


1(£;, b2) 


and (Z,, b,) respectively. R(2;, a, ) 
From the first of equations (7:7); Fig. 1. Plane sheet bounded by simply-connected closed 
it follows that contour 
COS & Uy (4, Zp) + SIN & My (4, Zp) = 4 ey (Zp) + Py (Zo) at Q (8.1) 
and 
cos % U4, (b,,Z5) + sina u%(b,,2Z,) = 0, e,(Z,) + £,(Z,) at S. (8.2) 


Solving (8.1) and (8.2) for e,(Z,) and £,(Z,), we obtain 
ey (Z») =—*— {cos « [ty (ay, Za) — 044 (b, Za)] + sin ot [eg (4, Za) — ty (b1, Ze) ]} 


a, —b, 
and (8.3) 


p1 (22) => ; {cos o [by My (a, Zp) 4, Hy (by, Zp) ] Fin o [by ty (ay, Zp) — Ay He (by, Z) J} 


1 Ay 


Again, from the second of equations (7.7), it follows that 


COS & Uy (Z,, Mg) — SIN & Ug (Zy, Ay) = Ay&g(Z,) + 2(Z,) at R (8.4) 


and 
COS &U,(Z,, by) — Sin & Uy(Z,, by) = by @(Z4) + 2(Z,) at T. (8.5) 
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Solving (8.4) and (8.5) for e)(Z,) and p2(Z4), we obtain 


€2(Z4) = {cos a [4 (Z,, 4a) — Hy (Z,, by) ] — sim a [2 (Z1, 42) — Me (21, by) ]} 
i Cy 
and (8.6) 


p2(Z4) = =, {cos & [by uty (Zy, dy) —A2% (Z,, by) |—sin & [by Mz (2, 42) — Ay Up (24, b.) |}. 


Introducing (8.3) and (8.6) into (7.8), we arrive at 


u4(Z,,2Z2) = 2 


as {(Z, b,) [uy (a, Z) + tan a U(a, Ze) | — 
— (Z,— a) [m4 0, Z,) + tan « #2 (67, Z5))]} = 


Aeon {(Zs - bs) [uy (Z, 4) — tana uy (Zy, “all a 
— (Z— a) [%(Z,, ba) — tan xu, (Zy, be) ]} 
and ; (8.7) 
Uy (Z1,Z2) = - {(Z, by) [cot « #4 (a,,Z2) + U2 (4,22) | — 
( 


2 (a, — by) ; 
— (Z,— a) [cot au (,,2Z,) + Ue by, Za)it= 


1 {(Z_— be) [cot a (Z,, a2) — a(Zy, 42)] — 
— (Z,— ay) [cot am (Z1, bg) — Ue(Zy, by) |}. 


Thus if ~; are known on the entire boundary C, they are uniquely determined 
throughout the sheet by equations (8.7). 


We shall now suppose that a portion AB of the contour C is formed by a 
cord Z,—const., as shown in Fig. 2(i). It follows from the first of equations 
(7.7) that u, cos « +, sin « is a linear function of Z, on AB. Consequently, if # 
is specified on AB and wy is specified at two points of it, vw, can be determined 
over the whole of AB. Again, if uv, is specified on AB and , is specified at two 
points of it, #, can be determined over the whole of AB. It follows that if 
is specified over the whole of the contour C and uw, is specified on the whole of 


g 3 


) (i') 


Fig. 2. Plane sheets bounded by simply-connected closed contour part of which is formed by a cord 


the contour C except AB and at two points of AB (which may be the end-points 
A and B) then u, can be determined over the whole of the contour C and equations 
(8.7) used to determine u, and uw, throughout the sheet. Alternatively, if w, is 
specified over the whole of the contour C and w is specified over the whole of 
the contour C except AB and at two points of AB (which may be the end-points 
A and B) then ~, can be determined over the whole of the contour C and equations 
(8.7) used to determine u, and uw, throughout the sheet. 
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We now consider that a portion EF of the contour C is formed by a cord 
Z,=const, as shown in Fig. 2(ii). It follows from the second of equations (7.7) 
that u, cos x — uy sin « is a linear function of Z, on EF. By an argument similar 
to that used in the previous case, we see that if one of the displacement com- 
ponents w; is specified on the whole of the contour C and the other at all points 
of the contour C except EF and at two points of EF (which may be the end- 
points & and /*), then both components of wu, can be determined over the whole 
of the contour C and equations (8.7) used to determine u;(Z,,Z,) throughout 
the sheet bounded by C. 

It follows from this result that if the contour C is formed entirely by four 
cords, then if #, is specified at all points of C and uw, at the vertices, wu, may be 
determined over the whole of C. Alternatively, if u, is specified at all points of C 
and w, at the vertices, wu, may be determined over the whole of C. In either case, 
equations (8.7) may then be used to determine w, and u, throughout the sheet. 


9. Solution of the Problem when Edge Tractions are Specified 
We consider the sheet of material shown in Fig. 1 and described in § 8. We 
assume that the edge traction &; are specified over the whole boundary C of the 
sheet. Then, on C we have, solving equations (7.10) for e,(Z,) and e,(Z;), 


PVA ee d(&,(Z,,Z,) sin a+&,(Z,, Z,) cos «] 
a EE (OZ cos &-— 1, (2,9 2,) sin 
and a (9.1) 
pli &(&, (21, Z,) sin «—&(Z,, Z,) cos a] © 
Oe ie PLM, (ZZ) Cos = (ZZ) sin whe 
Buovaded: that M,(Z,,Z,) cosa + M,(Z,,Z») sina +0. (9.2) 


The condition (9.2) will, of course, be violated at points on C where the tangent 
to C is parallel to a cord direction. 

If at a point on C the tangent to C is parallel to Z,=const, then M,, M,= 
cos «, sina. We then obtain, from (7.10) and (4.7), 


GNVA = Sulu Ze) SRL ABT (9.3) 


x COS % k sin « 


Again, if at a point on C the tangent to C is parallel to 7;=const, then M,, M,= 
cos a, —sina. We then obtain, from (7.10) and (4.7), 


ad ad 
E,(Z,, 2) — 


k cos a k sin « 


é(Z_) =— &(Z,, 22). (9.4) 


If the points Q, R, S and T are such that the condition (9.2) is not violated 
at any of them, then, from (9.1), we obtain 


ee es was 
ait) =fGesdene he edenel ak, 96 
l= Teoma S| OT 
ey SE OO aa 
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Comparing equations (9.5) and (9.7) and equations (9.6) and (9.8), we see 
that €, cannot be arbitrarily specified on the boundary, but must satisfy the 
conditions 


E,(a,,Z.) sin a + & (4,22) COS a = &,(b,, Z,) Sin & +- Eo (dy, Z 2) COS 4 
M, (a,, Z,) cos « —M, (a,, Z,) sin « M,(b,, Z,) cos « — M, (b,, Z,) sin « (0.9) 
and : 
E,(Z,, a2) sin « — &(Z,, a) COS % E,(Z,, by) sin « — E,(Z,, b2) Cos « 


cos a + M,(Z,, 6.) sin « * 


— 
So 


M,(Z,,a,) cosa+M,(Z,,a,)sina M,(Z,, b, 
Introducing (9.5) and (9.6) into (7.8), we obtain 


as d[&, (a,,Z,) sin a + & (a, Ze) cos a] 
2icos a Mil Zs, 24) “a as eet (oe) 


Z @[&,(Z,, ay) sin « — &(Z,, aa) cos a] 
2 k[M,(Z,, a) cos a + M,(Z,, a) sin «] 


+ bi (22) + b2(Z1) 
and (9.10) 


: za a [&,(a,,Z,) sina + & (4,2) cosa] _ 
DSM aN Zar 0a) te leg ana | oe 


Z d[E,(Z,, a) sin « — &(Z,, az) cos x] 


2k (M,(Z,, a) cos « + M,(Z,, a) sin «] 
+ Pi (Ze) — b2(4Z)- 


We see that «; are undetermined to the extent of a displacement field w; of the 
form 
2. cos % Uy = p, (Z2) + p2(Z1) 
and (9.11) 
2sin x Ms = p,(Z2) — p2(Z), 


which is an arbitrary (small) displacement field for which cord lengths remain 
unchanged. This indeterminacy of the displacement field w,; is not surprising 
in view of the fact that the fabric may be subjected to any deformation in which 
the lengths of cord elements are unchanged, without forces being applied. 


If at one or more of the points Q, R, S, T, the tangent to C is parallel to 
Z,=const, we obtain e,(Z,) from (9.3) and a knowledge of either &, or &, at that 
point. Similarly, if at one or more of the points Q, R, S, T, the tangent to C 
is parallel to Z;=const, we obtain ¢,(Z,) from (9.4) and a knowledge of either & 
or €, at that point. These relations may then be employed together with relations 
chosen from (9.5) to (9.8), appropriate to those of the points Q, R, S, T at which 
the tangent to C is not parallel to a cord, to provide expressions for e, (Z,) and 
€,(Z,) at P. These expressions may then be introduced into (7.8) to give expres- 


sions for #(Z,, Z,) and u,(Z,, Z) at P. By way of illustration, we consider below 
two cases. 


(1) Sheet bounded by cords. We consider the boundary C of the sheet to be 
formed by the cords Z,=¢,, Z,=0,, Z,=a,, Z,=b,, as shown in Fig. 3. Let P 
be a generic point (Z,,Z,) of the sheet and let Q, R, S, T be the intersections 
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with C of the cords through P. We then have, from (9.3) and (9.4), 


d de 
€9 (24) = eae eu ay) = — Fein g 62(Z1 %) Ayan h 

d d 
€(Z4) sa by) = — = 82(Z1, ba) twit, 

Zz (9.12) 
é(Z,) = — aye Ei (4,29) = — Hsing 62 (4 22) at Q, 
d ad 

€(Z2) = paeemege CREA) = — = — $2 (br, 22) al 


Introducing (9.12) into (7.8), we obtain expressions for uw; with an arbitrariness 
corresponding to a small deformation of the sheet in which the lengths of cord 
elements are unaltered. 


DG LA 
R(2;, b2) a of : 
1727 


7(Zy1 02 ) 


(2; 0) 
Ola, ,Z,) 


R(Z7,b2) 


Fig. 3. Plane sheet bounded by four cords Fig. 4. Plane sheet bounded by two cords and an arc 


(21) Sheet bounded by two intersecting cords and an arc. We consider the bound- 
ary C of the sheet to be formed by the cords Z,=a, and Z,=a, and by an arc 
which is nowhere parallel to a cord, as shown in Fig. 4. Again P is a generic 
point of the sheet and Q, R, S, T are the intersections of the cords through P 
with the boundary. Suppose that S and RF are the points (b,,Z,) and (Z,, b) 
respectively. 

From (9.3) and (9. va we have 


€2(Z;) = Ei (21, a2) = 


Pd eae ae (9.13) 
€(Z2) = oe ~§ (a, 2) = — ean Eo(4,Z,) at Q 


From (9.1), we have 


— 4[&,(0,,Z,) sin «+ &(6,, Z,) cos «] 
a2 eee G. Z,\snals 
Gd [E,(Z,, bg) sin « — &(Z,, bg) cos «] aye 
k[M,(Z,, 6.) cos «+ M, (Z,, by) sin a] 
Employing either (9.13) or (9.14) in (7.8), we can obtain the displacement wu; 
throughout the sheet, with an arbitrariness corresponding to any deformation 


in which lengths of cord elements are unchanged. 


and (9.14) 


€2(Zy) = 
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We note that if the edge tractions are specified on the bounding cords, then 
it is sufficient that only one of the components &; be specified on each of these 
cords. On the other hand, if the edge traction is specified on the bounding arc 
then both of the components &; must be specified. 


10. Mixed Boundary Value Problems 

In this section we shall discuss a few examples which illustrate the manner 
in which the results obtained in the previous sections can be used to determine 
the displacements throughout a sheet when the boundary conditions are of the 
mixed type, i.e. displacements are given on parts of the boundary and edge 
tractions on other parts. 

(‘) Sheet bounded by cords. We consider the sheet of material bounded by 
four cords as shown in Fig. 3, and assume that the displacement component 
is specified on the edges 7, =), and Z,=6,, while the component of edge traction 
&, is specified on Z,=a, and Z,=a,. From (9.3) and (9.4), we have 

d 


€(Z;) = Froggy $1(4r %) at T 
and es (10.1) 


d 
€(Z,) = — E,(a,Z,) at Q. 


R Cos a 
From the first of equations (7.8), we obtain 


2 COS % Uy (b1, Zp) =, & (Zp) +25 es (Dy) + £1 (Ze) + oli) at S, 
2 COs % Uy (Z1, by) =Zy ey (by) + by ea (Z1) + fi (b2) + 2(Z,) at R (10.2) 
2 COS % My (Dy, Dy) = Dy ey (By) + dg ey (by) + Py (D2) + Do (Ox) at Z,=),, Zz=Ddzg. 


Employing the first two of equations (10.2) to eliminate #,(Z,) and £,(Z,) from 
(7.8), we obtain 


2 COS a (2,25) = 2cosa[u(Z,, b,) + u,(b,,Z2)| + 
+ (2, — },) &,(Z,) + (Z_ — be) eg (Z4) — 
— £1 & (bx) — Zp € (by) — Py (Ba) — Po (da) 
2SiN & Ug(Z,,Z,) = 2cos a[m,(b,,Z.) — u(Z,, bg)] + 
+ (41 — by) 1 (42) — (Za — 85) €9(Zq) + 
+ 2464 (be) — Zo 0 (b1) + Py (b2) — po (br). 
Eliminating p, (6) + £2 (04) from (10.3) and the third of equations (10.2), we obtain 
2 cos a 4; (2,,Z,) = 2cosa[u,(b,,Z 3) + m4 (Z,, b,) — Uy (dy, by) | + 
+ (41 — by) [e(Z2) — & (b)] + (10.4) 
+ (22 — bs) [e(Z1) — ey (by)]. 


and 


and 


(10.3) 


From (10.1), we have 
Sop ot (as 42) 


GVaha by. Ros @ 


€ (02) = — 


and 


(10.5) 
51 (4, bg). 


k cosa 
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Introducing (10.1) and (10.5) into (10.4) and the second of equations (10.3), 
we obtain 
(2,29) = uy (b), 2) + Uy (Zy, by) — ty (21, bg) — 


ay: oa ot UA by) [€, (4,22) — &(&, b5)] — 


Bd — (Z,— be) [& (21, a2) — & (01, ay) ]} (10.6) 
U_(Z1,Z2) = cot «| (b,,2,) — m4 (Z,, bg) ] — 


FZ = by) (ayn Za)s + (Zornibs) i (Zas 40) 


Resin 20 


st fog nl ey AV Ae VASA ig ty ee a as 2 


2si1n « 


Thus, if u, is specified on Z,=b, and Z,=6, and &, is specified on Z,=a, 
and Z,—a,, then uw, is determined throughout the sheet and w, is determined 
throughout the sheet apart from a constant. If, further, wu, is specified at a 
single point of the sheet, then ~, is completely determined throughout the sheet. 

(21) Sheet bounded by two cords and an arc. Prescribed tractions on the arc and 
displacements on the cords. We consider a sheet of material bounded by the cords 
Z,= a, and Z,=a, and by an arc which is nowhere parallel to a cord, as shown 
in Fig. 4. We assume that , is specified on the cords Z,=a, and Z,=a, and 
that the edge traction &; is specified on the arc. 


Then, from the first of equations (7.8), we obtain 


2 COS & My (Zy, Ay) =Z, &; (Ag) + Ae Cy (Z,) + 1 (4g) +2 (Z) at T, 

4 2 COS & Hy (4, Zp) = Ay &y (Zg) +25 €2 (4) + Py (Ze) + fo (4) at Q (10.7) 
2 COS & Uy (Ay, Az) = Ay ey (Ag) + Ay ly (%) ee 2) +P2(%) at Z;=a,, Z,= ap. 
From (10.7) and (7.8), we obtain, in a manner similar to that used in discussing 
case (2), 


an 


2.cos % 44 (21,22) = 2cosa[m (4,22) + My (Z15 4) — M4 (4%, 42)] + 
+ (Z,— 4) [@(Z2) — 1 (42)] + 
+ (Zp — 42) [€(Z1) — &(4%)] 
Rs oe eerie ae) a ae aes 
+ (Z,— a) &(Z2) — (Zy— 4g) €3(4) + 
+ 2, € (ag) — Zee (4) + py (42) — p2(%)- 


Now, solving equations (7.10) for e,(Z,) and e,(Z,) and employing (4.7), we obtain 
bia) a= d[é 1(Z,, Z,) sin « + &3(2Z,, Z2) cos «] 
d 2 k(M,(Z,,Z,) cos « — M,(Z,, Z,) sin «] (10.9) 
pi 7) 2 Alb (Zi, Z,) sin a &, (Z,, Z,) c08 a] 
€y(Z,) RLM, ( 


3(Z,,Z_) cos a+ M, (Z,,Z,) sin a] * 
n (10.9), the denominators are not zero on the bounding arc, since the arc is 
nowhere parallel to a cord. From (10.9) we have 
_ _4[&(b, Z,) sin a + §3(b,,2,) cose] 44 
Nee Mabe Woe cose a (2) ical 
Merde (Z,,0,) sino. — €, (Z,) by) Cos a] t R 
Pee WNT (28) Sina] 


and (10.10) 
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If the points of intersection of Z,=a, and Z,=a, with the are are denoted 
(a, Cy) and (c,, ay) respectively, then from (10.9) we obtain 


oy (dg) =H UEaleas ae) sin a + Fal, ae) 008 
ee k[M,(c,, 4) cos « — M, (c,, a,) sin «] 
é,(a) = _G[E, (a, Cy) Sin & — Fy (ay, 6p) COS a] 
21! “RM, (a,, C,) cos a + M, (a, C2) sin a] © 


and (10.11) 


Employing equations (10.10) and (10.14) to substitute for ¢ (24), €(Z4), €(@e) 
and ¢,(a,) in (10.8), we obtain expressions for #;(Z,, Z,) in terms of the known 
value of u, on the bounding cords Z,=a, and Z,=a, and the known values of 
the edge tractions £; on the bounding arc. We note that uw, is determined to 
within an arbitrary constant. However, if u, is prescribed at a single point of 
the sheet, it is then completely determined throughout the sheet. 

(iii) Sheet bounded by two cords and an arc. Prescribed tractions on the cords 
and displacements on the arc. We again consider the sheet shown in Fig. 4, but 
we now assume that the displacement components wu; are known on the arc and 
the component of edge traction &, is known on the cords Z,=a, and Z,=ay. 


From (9.3) and (9.4) we obtain 


(Ze te iedaae 
COS «@ 
and Z (10.12) 
€;(Z,) =— _——§,(4,Z,) at Q 
k cos a 


From (7.7) it is seen that 


COS & 4, (Z,, 0.) — Sina Uy (Z,, Oo) = bao(Z,) + H9(Z,) at-R 
and (10.13) 
COS & My (0,25) + SIN % My (b1,Z9) = 1 &(Zy) + f,(Z9) at S. 


Employing (10.13) to eliminate #,(Z,) and £,(Z,) from (7.8), we have 
2.COS % H(Z,,Z5) = cos «[M,(b,,Z_) + 4, (Z,, by) ] + 

F Sin & [Mp (b,,Z) — U(Z;, by) + 

+ (4, — 64) € (Zo) + (22 — bg) es (Z4) 

2sin « Uy(Z,,Z,) = cos a[m,(b,,Z,) — u,(Z,, be)] + 

+ sin a [%.(b,,Z_) + U4g(Z,, b9)] + 

+ (4; — 21) €) (2) — (2, — bg) €(Z,). 


Substituting for €2(Z,) and e,(Z,) from (10.12) in (10.14) we obtain expressions 
for u;(Z,, 22) in terms of the known component of edge traction & on Z,=a, 
and Z,=a, and the known displacement components on the bounding arc. 


| 


and (10.14) 
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Iterationsverfabren mit veranderlichen Operatoren 


HANS EHRMANN 


Vorgelegt von L. COLLATZ 


§ 1. Einleitung* 


Iterationsverfahren der Gestalt 
(124) Up le, Op ee Dy aes 
zur Lésung einer Gleichung 
(1.2) u=Tu oder Su=O, (O=Nullelement), 


wobei die GréBen wu, u,,v=0,1,2,..., Elemente eines abstrakten Raumes 
(z.B. eines Banachraumes) sind und J einen Operator bedeutet, sind in den 
letzten Jahren viel in bezug auf Konvergenzfragen, Konvergenzverbesserungen, 
Fehlerabschatzungen usw. untersucht worden**. Dabei zeigte es sich, daB viele 
bei speziellen Gleichungstypen bekannte Konvergenzkriterien und Fehler- 
abschatzungen, die vielfach in jedem speziellen Falle neu bewiesen wurden, 
Spezialfalle von z.T. sehr einfachen und leicht zu beweisenden abstrakten Satzen 
sind und da sich die Verschiedenheit von speziellen Konvergenzbedingungen 
und Fehlerabschatzungen aus der verschiedenen speziellen Wahl der Metrik 
ergibt [3], [5], [10]. In den meisten Fallen beruht die Konvergenz bei den betr. 
Satzen auf der Eigenschaft des Operators T zu kontrahieren, und im einzelnen 
wird gewohnlich gezeigt, da die Summe der Abstande von w,., und wu, fiir 
n=0,1, 2,... konvergiert, was i. allg. mit Hilfe des Majorantenprinzips mittels 
einer Vergleichsreihe mit positiven Elementen geschieht, deren Konvergenz 
bekannt ist. Durch die abstrakte Formulierung der Satze gelingt es zunidchst, 


* Dies ist ein erster Auszug einer Arbeit ,,Untersuchungen von Iterationsver- 
fahren zur Lésung allgemeiner Gleichungen“‘, die im November 1958 von der Fakultat 
fiir Natur- und Geisteswissenschaften der Technischen Hochschule Stuttgart als 
Habilitationsschrift anerkannt wurde. Die Untersuchungen entstanden wahrend 
meiner Tatigkeit als Assistent am Institut fiir Mathematik und Mechanik der Berg- 
akademie Clausthal bei Herrn Professor H. K6nic und am Mathematischen Institut A 
der Technischen Hochschule Stuttgart bei Herrn Professor G. ScHuLz. Daneben hat 
Herr Professor L. Corratz die Arbeit verfolgt und mich durch einige wertvolle Rat- 
schlage und Hinweise unterstiitzt. Allen drei Professoren méchte ich fiir ihre freund- 
liche Unterstiitzung herzlich danken. 

*x Siehe u.a. das Literaturverzeichnis am Ende der Arbeit. Hierauf beziehen 
sich die Literaturangaben in eckigen Klammern. 
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einen wesentlich gréBeren Kreis von Gleichungstypen (Gleichungssysteme, 
Differential- und Integralgleichungen usw.) zu erfassen. In der weiteren Ent- 
wicklung wurde sodann versucht, Konvergenzbedingungen und Fehlerabschat- 
zungen der betr. abstrakten Satze zu verbessern, indem die Definitionen insbes. 
der Metrik weiter verallgemeinert wurden, um die Abschatzungen dem jeweiligen 
speziellen Problem besser anpassen zu kénnen. Dabei werden auch metrische 
Raume mit ,,Abstainden“ ihrer Punkte zugelassen, die keine nichtnegativen 
reellen Zahlen sind, [2], [7], [9]. Solche allgemeineren Raume, die den Banach- 
raum als Spezialfall enthalten, werden wir auch hier zugrunde legen = 


Es treten nun Falle auf, in denen z.B. die Iteration (1.1) noch sehr mihsam 
ist, so daB man zweckmaBig wenigstens in den ersten Schritten 7 durch einen 
Naherungsoperator T ersetzt, oder T ist von vorneherein nur naherungsweise 
gegeben etwa in Form einer unendlichen Reihe, von der in (1.1) jeweils nur 
endlich viele Glieder beriicksichtigt werden kénnen, oder die Lésung wu erscheint 
in Form einer unendlichen Reihe wie z.B. bei dem bekannten Verfahren zur 
Auflésung einer Gleichung der Form «=f(x, 4), wobei man / an einer Stelle x9 
nach Potenzen von A entwickelt, die Reihe abbricht, rechts fiir x einsetzt, wieder 
entwickelt, abbricht, einsetzt usw.: 


for 
Nyty =f (Xn, A) = Zon Aveaende if (Sere A) = 2 ann fe 
vkn y= 


Diese Fragestellungen fithren auf das Problem, Iterationsverfahren der Form 


(1.3) Cea ios] Ly Uy 


zu untersuchen, wobei sich also die Operatoren J, von Schritt zu Schritt 4andern 
kénnen. Hiermit beschaftigt sich die vorliegende Arbeit. Es wird ein abstrakter 
Satz aufgestellt und bewiesen, der Bedingungen angibt, unter denen die Iteration 
(1.3) gegen eine Lésung der Gleichung (1.1) konvergiert. AuBerdem wird eine 
Fehlerabschatzung angegeben, die unter den angegebenen Bedingungen nicht 
mehr verbessert werden kann. Der entsprechende Satz geht in dem Spezialfall 
I,=T, n=1,2,..., in bekannte Satze iiber [4], [9]. Jedoch versagt hier die 
iibliche Beweismethode. So braucht z.B. unter den getroffenen Voraussetzungen 
die Summe der Abstaénde von den aufeinanderfolgenden Iterationspunkten w, 44 
und u, (7=0, 4, 2,...) nicht zu konvergieren, noch kann man zeigen, daB diese 
Abstande schlieBlich monoton abnehmen. Obwohl der Satz dem Inhalt nach 
ganz elementar ist, ist er meines Wissens auch im einfachsten Fall einer unbe- 
kannten Zahl noch nicht in dieser Form mit Konvergenzbeweis und Fehler- 
abschatzung bekannt. Andererseits ist die hier durchgefiihrte abstrakte Formu- 


lierung so allgemein, da der Satz auf sehr verschiedenartige Gleichungen leicht 
angewandt werden kann. 


In § 2 werden alle funktionalanalytischen Hilfsmittel zusammengestellt. § 3 
bringt den Satz und Beweis sowie einige fiir die Anwendungen auf den Nachweis 
der Existenz von Lésungen und ihre Abschatzungen wichtige Folgerungen. 
In §4 werden schlieBlich einige Beispiele durchgefiihrt. 


* Vel. insbes. J. SCHRODER [9]. 
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§ 2. Funktionalanalytische Voraussetzungen 

Fiir je zwei Elemente u,vCR sei ein Abstand (u,v) definiert, wobei die 
Abstande o,o,... Elemente eines linearen halbgeordneten Raumes N sind: es 
ist in N eine Addition o+o und eine Multiplikation « o mit reellen Zahlen « 
definiert, und diese Operationen geniigen den tiblichen Rechenregeln der Vektor- 
algebra. Ferner ist N halbgeordnet, d.h. es sind gewisse Elemente 9, o€N als 
positiv definiert: @ 20 (0 = Nullelement von N), wobei op=0 und — 90 (gleich- 
zeitig) nur fir e=O gilt und e+c=0 aus 0,020, sowie «920 aus «0 
(x reelle Zahl) und ¢=0 folgt. e=o oder oXo bedeutet 9p —c=0. 

Ferner ist gewissen (konvergent genannten) Folgen 0,€N (n=1, 2, 3,...) 
ein (eindeutig bestimmtes) Grenzelement lim 9,,€ N zugeordnet mit den Eigen- 
schaften *: 

a) aus ¢,—e fiir n=1, 2,3, ... mit einem festen Element @ folgt lim 0,=0, 


b) aus lim e,—e@ folgt lim @,,=@ fiir jede monotone Folge natiirlicher 
Lamlen kg 1, 2635s) 3 
c) aus lim e,=@ und limo,=o folgt lim(e,+o,)=e+o, 
(2.1) d) aus lima,=« (a,, « reelle Zahlen) und lim 9,=o folgt liim«,o,=ao, 


) 
) 
e)2Uss O= 0, =¢, lat 721, 2, 35-..,und limo,—0 iolet lime, 0; 
Liealis @72= Our == 1, 2..3, -. und lime), =o loletio=0) 

) 


g) aus 0X0, Xt fiir n=n, und lime, =0 folgt die Existenz einer Nummer 
nm, mit 0, = fiir n=n,. 


Ferner gelten fiir den beziiglich N metrischen Raum R die Abstandspostulate: 
1. o0(u, v)=0 genau dann, wenn u=v gilt, 
2. 0 (u, v)Se(u, w)+e(v, w) fiir jedes Elemententripel u,v, w¢€R (Dreiecks- 
gleichung). 
Daraus folgt dann die Symmetrie, o(#, v) =e (v, uw), und die Definitheit, o(u, v) 20, 
des Abstandes. Man beweist leicht, daB die Axiome (2.1e) und (2.1g) in dem 
obigen System aquivalent sind den Axiomen: 


(21e') Aus t,=0,0, fir n=1, 2,... und lint,=limo,—o folgt limoe,=o 
bzw. 

aus OSXo,X<7 fiir n=, und lime, =0 folgt fiir jede natiirliche Zahl k 
218) die Existenz einer Nummer V(r) mit 0, < = fiir n= N(R). 


Die Konvergenz einer Folge u,—>u, n=0, 1, 2,... in R ist stets im Sinne 
der sog. starken Konvergenz beziiglich der Metrik N zu verstehen, d.h. 


(22) u=lim u, ist dquivalent lim oe(u,,u) =0. 
n—> oo 


n—> CO 


* Die Axiome a) bis f) sind wértlich von J. SCHRODER [9] tibernommen. Zum 
Beweis des in § 3 aufgestellten Satzes tiber Iterationsverfahren mit veranderlichen 
Operatoren (1.3) erwies sich das zusatzliche Axiom g) als erforderlich, dessen Unab- 
NX 


4+ n? x? 


hangigkeit von den iibrigen etwa durch das Beispiel e, = f, (¥) = 


1 
pboaKal 7p * 
im Raum der stetigen Funktionen gezeigt wird. 
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Man zeigt leicht: 
(2.3) AUS U,—>U, U_,—>v folgt @ (Un, Un) > @(Y, 2). 

AuBerdem wird R als vollstindig vorausgesetzt, d.h. fiir jede Folge {w,} 
in R, fiir die das Cauchysche Konvergenzkriterium | da 68 (u,, u,) = 0 gilt, existiert 
ein Grenzelement “= jim wu, in R. 

Der beziiglich N metrische Raum R heiBt lokalkompakt, wenn jede unendliche 


Folge u,€R, »=0,1, 2,..., fiir die o(u,,v)So0, n=0,1, 2, ..., mit v€ R und 
o€N gilt, eine konvergente Teilfolge wu, besitzt. 
Eine Folge von Operatoren J,,, »=0, 1, 2,..., die in einem Gebiet D von R 


definiert sind, konvergiert dort stetig* gegen einen Operator T, wenn fiir jede 
Folge {v,} aus D, die gegen einen Punkt v von D konvergiert, der Grenzwert 
dim, T,v, existiert und gleich Tv ist. 

Eine Folge von Operatoren T,,, »=0, 1, 2,..., konvergiert in einem Bereich G 
ihres Definitionsbereiches Reine gegen JT, wenn o(T,u, Tu)So fir alle 
u€G mit einer GréBe o€N ist und nach Vorgabe einer positiven Zahl k eine 
Nummer (k) existiert derart, daB 
o(L,, 4, Tus fir nm=2n(k) und alle ucG 
gilt. 

Ein in einem Bereich G eines beziiglich N metrischen Raumes FR definierter 
Operator T heiBt dort beschrankt, wenn 


(2.4) o(fu, Tv) S Pow, v), u,veG, 


mit einem linearen, stetigen und positiven Operator P gilt. Dabei heiBt P linear, 
wenn P(xe+fo)=aPe+fBPo (a, 6 reelle Zahlen, 0,o€N) gilt, stetig, wenn 
lim Pe, = Pe aus lime,=e, und fositiv, wenn Po=0 aus o=0 folgt. 


Ein linearer positiver Operator P ist auch monoton, d.h. es gilt 


(2.5) aus @2o0, P linear, positiv, folgt Poe= Po. 
SchlieBlich verwenden wir noch folgenden einfachen 
Hilfssatz 1: Fir die Folge von Operatoren T,, n=O, 1, 2,... gelte in einem 
Bereich G thres gemeinsamen Definitionsgebietes DCR 
(2.6) Jim @ (Tu, Lh 210), ucG, 
und 
(2.7) O(1 U1 e) SP Or Oe Mees, Meee u,veG, 


mit einem stetigen Operator P. Dann konvergieren die Operatoren Wyo need 
stetig in G. 


Bewets. Es gelte lim v,=v,v,,UCG. Dann folgt nach der Dreiecksungleichung 
Unda 2 74) 

OSe(7,2,, Tv) So(Z,»,, Tv) + 0(L,v, Tv) S Polu,, ©) col Lote Lan) 
Hieraus ergibt sich wegen (2.6) und der Stetigkeit von P mit (2.4c) und (2.1 e) 
die Behauptung. 

* Vgl. C. CaratHtopory [13] (S. 4ff.). 
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§ 3. Der Fixpunktsatz 
Wir treffen folgende allgemeine Voraussetzungen: 


A. Es set R ein beztiglich eines linearen halbgeordneten Raumes N metrischer, 
vollstindiger Raum*. Dabei sei die Konvergenz in N durch die Axiome (2.1a—g) 
festgelegt. 

B. Ferner set eine Folge von in einem gemeinsamen Teilgebiet D von R definierten 
Operatoren 
(3.1) TE oe 


gegeben mit den Eigenschaften: 
1a. Die Folge (3.1) konvergiert gleichmaBig*» ** in D gegen einen Operator T 
(3.2) lim o(Z),u, Tu) =0, ucD. 
n—-> CO 
Statt der gleichmafigen Konvergenz kénnen wir fordern: 


1a’. Der Raum R ist lokalkompakt* und es gilt (3.2) ohne die Bedingung (2.18). 

2. Die Operatoren (3.1) seren in einem beschrankten Teilgebiet G von D gleich- 
mapig beschrankt, d.h. es existiert ein stetiger, positiver, linearer Operator P, so daB 
(3.3) Ol unl v) = Bolu, 0); i=) hs Wie 2a u,v€GCD, 


gilt. 

3. SchlieBlich existiere eine obere Schranke uC N derart, daB an einer Stelle Ug 
von G 
(3.4) 0 (Lo 4, LM) SH, n=O, 50s re or U,EG, 
gut. 

Es ergeben sich einige einfache Folgerungen aus A und B: 

Zunachst folgt aus (3.2) und (3.3), daB auch der Grenzoperator T beschrankt 
ist mit demselben Operator P, d.h. es gilt 


(3.5) o(Tu, Tv) S Pou, v), u,veG. 
Dies folgt aus (2.3) und den Axiomen (2.1a, c, d, f) auf die Folge 
tg— PP ou, v) — o(L, u; Tv) 2 0, OA, 2 eres 


angewandt. 
Aus (3.3) und (3.4) folgt fiir das gesamte beschrankte Gebiet G die Existenz 
einer oberen Schranke fiir o(T},u, T,u): Zunachst folgt aus der Dreiecksunglei- 


chung (3.3) und (3.4) fiir #€G 
o (Zou, T, u) Se (Tou, Ty Mo) + @ (To Mo, Tn Mo) + @ (Ln Mo» Ly wt) 
S2Po0(u,%)+uSsh, N= O45 2, eeiy 


* Beziigl. der Definitionen siehe § 2. 
**x Spater werden wir uns noch von dieser Voraussetzung befreien. 
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denn da G beschrankt ist, liegt o(w, %) und damit auch 2Po(u, m4») unter einer 
festen Schranke. Weiter folgt aus der letzten Gleichung 
(Ty, T, #) Se (To, Tn) +o (Lou, 1,4) S 2H, 


6 
(3.6) i, W=OAL QW, EG: 


LaBt man hierin m->co gehen, so ergibt sich nach einfacher Uberlegung 
wegen der Stetigkeit des Abstandes [(2.3)] auch 


(3.7) o(Z,,4, [u)s24, m=0,1,2,..., UucG. 
SchlieBlich folgt nach Hilfssatz 1 noch, daB die Folge der Operatoren 7, 


in G stetig gegen T konvergiert. 
Unter den allgemeinen Voraussetzungen A und B gilt der 


Fixpunktsatz: Es gelte* 
T> = 0(L, Mo» Lo %o)> Tim Ol eee 
Liegen uy und alle u, fiir die** 
(3.8) o(, %) S (E— P) Po (ty, m) + (E— P)Am=0 


gilt, in dem Giiltigkettsbereich G der Gleichung (3.3) und konvergiert die Neumann- 
sche Rethe 


(3.9) > P’o fir alle o€N, 
»v=0 

so konvergiert das Iterationsverfahren 

(3.10) Unty fm 1 Uy, 


gegen die einzige Lésung u der Gleichung 
u=TIu 
in G und es gilt die Fehlerabschatzung *** 
(3.11) @ (4, %) S(E — P)+ Pe (uy, m) + (EZ — P)+0(T %, %). 


; Bewets. 0.) Mit P ist** auch (E—P)+ ein positiver Operator. Daher ist 
die rechte Seite von (3.8) o20. Es liegt also u, in dem durch (3.8) gegebenen 


Bereich von G. Wir treffen die Induktionsannahme, daB u,, v3, ...,u, in G 
legen. Dann sei ftir 7=1, 2,...,s---4 : 
(3-12) ty 0 bus, Laut en 


Die Existenz dieser oberen Schranken t,, folgt aus (3.4) und (3.6). 


* Die Existenz einer solchen oberen Schranke er 
allo (Gi), a det. Gee E 
eine kleinste obere Schranke, so wird man zweckmaBig ao ie Clee Wn I, Ue) es 


*xk Die Existenz des ees (2 — P)]tolgt aus der Konvergenz der Reihe (3.9), 
und es gilt (E — P)- Ore Pe, @cN, siche J. SCHRODER [9}. 


*kk Diese Fehlerabschatzung 1aBt sich natiirlich auch mit u 


und 
und % schreiben, was nur eine andere Zahlung bedeutet. ae pertain 
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Sodann beweisen wir durch vollstandige Induktion 
O(Un+e, Uy) = (E = Ps Po(u,, Uy—1) a (E a gia Ty-1 = Oy 
ius SSS onl (2 220), 


(3.13) 


Es ist o,=0 fiir alle x. Daher ist (3.13) fiir k=O und 1<”<s erfiillt. (3.13) 
sei fir k=0,4,-..,7 erfillt, und es mégen 4, 1,4), 4,47, --+5 ¢44,0in dem 
Giiltigkeitsbereich G von (3.3) liegen. Dann folgt aus (3.3), (3.12) und der Drei- 
ecksungleichung 


Q (Un+rta Uy) = 10 (Oia Untys T,-1 Un —1) 
(3.14) gE Q (fay Untr> Dy Un) =F Q (Eee wR Un 1) 
s 2 O(Un+r> Uy 1) at Ty-1> 


Da nach (2.5) der lineare, positive Operator P auch monoton ist, gilt nach der 
Dreiecksungleichung 


ie O(Un+ys Uy—1) = a O (Unt U,) Po(uU,,; Uy, 4) : 


Setzt man dies in (3.14) ein und sodann fiir @(u,,,,u,) die rechte Seite von 
(3.13), was wegen der Induktionsvoraussetzung fiir k erlaubt ist, so ergibt sich 


(3-15) 0 (¢nirsa Mn) S [P(E—P)>+ E] P o(u,, 4,1) + [P(E—P) 1+ E] t,_1. 
Nun ist aber 
[P(E —P)4++Flo=(E—P)*¢e fir alle EN, 
denn es gilt ; 
[P(E—P)1 + E]o—(E—P)19=[E—(E—P) (E—P)*]o =[E—E] 0=0. 


Daher folgt aus (3.15) die Beziehung (3.13) fiir k=v+1, also unter den obigen 
Annahmen fiir alle R20 und 1<”<s. Setzt man hierin »—1, so erkennt man, 
da fiir “) und wu, alle getroffenen Induktionsvoraussetzungen giiltig sind, daf 
die Iteration (3.10) nicht aus dem durch (3.8) gegebenen Bereich herausfiihrt. 
Es liegen damit alle wu, in G und daher folgt die Giiltigkeit von (3.12) fiir alle 
k=O und n=1. 

B) Wir zeigen weiter, daB 


(3.16) jim @ (2, Un—1) i ra Uy —1) = 0 


ist, wobei {/,,} eine (nicht notwendig monotone) Folge ganzer Zahlen mit J, =n 
ist. Dies ist wegen 


0 (Ti, Un nts) sh 14%y, 1) = o (Zi, Un —1> T u,-4) i o(Tu,_1, T,-1Un—1) 


der Fall, wenn die GroBen 


fiir m— oo gegen Null konvergieren. 
Dies ist aber offenbar wegen der gleichmaBigen Konvergenz (Voraussetzung 


B 1a.) der Operatoren T,, n=0,1, 2,..., also auch der Operatoren Ti, 5 m= 0,4; 
2, ...,R om, gegen T der Fall, weil nach «) alle u,, in dem beschrankten Be- 


reich (3.8) von G liegen. 
4* 
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Ist statt B 1a. die Voraussetzung B 1a’. erfiillt, so zeigen wir die Konvergenz 
der Folge 0,,—>0 fiir m—> oo folgendermaBen: 

Nach (3.7) und u,,€G fir m=O, 1, 2,... (siehe «)) liegen die Abstande g,, 
alle unter einer festen Schranke t. Wiirde o,, nicht gegen Null konvergieren, 
so gabe es eine positive Zahl p und eine Teilfolge 0,,, n=1, 2,..., fiir die die 


Gleichung 9,,S nicht erfiillt ist. Wir schreiben dafiir* 


(3.17) Oar ae ay ee 

Die unendliche Folge u,, besitzt wegen der Lokalkompaktheit des Teilraumes G 
von R eine konvergente Teilfolge. Wir konnen daher zugleich mit (3.17) annehmen, 
daB bereits #, , m=41,2,..., gegen ein Element v von G konvergiert. Wegen 
der stetigen Konvergenz der Operatoren JT, (Hilfssatz 1) konvergiert ** damit 
jede Folge 7, u,,, n=1,2,...,1,2%, gegen Tv, und hieraus folgt mittels der 


ae 


Dreiecksungleichung Pies 


n—> OO 


Dieses steht aber nach dem Axiom (2.1g’) im Widerspruch zu (3.17). Hieraus 
folgt, daB die Gréen o,, gegen Null gehen mit m-— oo, und damit ist auch die 


Behauptung (3.16) bewiesen. 

y) Wir wollen jetzt zeigen, daB die Folge {w,,} gegen ein Element wu konvergiert. 
Zu diesem Zweck beweisen wir zunachst die Ungleichung 

k 

(3-18) O(Unartar Unth—1) S P*Q (Une, Mn—a) + eae n,k2A, 
wobei die t; als obere Schranken gemaB (3.12) definiert sind und r=r(n, k) 
eine beliebige Doppelfolge natiirlicher Zahlen bedeute. 

Fiir k=1 erhalten wir nach (3.3), (3.12) und der Dreiecksungleichung 


O(Untrt1» Un) = 0 (Lies Untys [a U,—1) 


(3.19) = OWS ater Dal aia) =f o (TZ, t ry, 1> ibs 14y, 1) 
= PO (Wie tae ete. 1 eee 


Also ist (3.18) fiir k=1 und alle » und 7 erfiillt. Es sei (3.18) fiir k=1, 2,...,s 
erfiillt. Ersetzt man in (3.19) ~ durch m+ s, so ergibt sich unter Benutzung von 
(3.48) fir k=s 
O(Untrts+> Uy +s) = ed O(Unisrrs Un+-s—1) ote Tr+s—1 
SS pee O (Unies Uy 1) = Pe » ha Ups al ap Ty t-5—1 
y=1 


S+1 
S+-1 a] y—1 
= ie O(Unsys U,,—1) hi LP Tn +(stl)—»—1° 


Also ist (3.18) auch fiir k=s+1 und daher fiir alle A= 1 erfiillt. 
Nach «) und (3.8) gilt 


0 (Un, Uy) a O(Un, Uy) se 0(u,, Uy) = PX oy mM, n — Al 2; Seema 


x Man beachte, da8 aus @ £6 noch nicht 0 >o folgt. 
** Mit Z, konvergiert auch die INO Th tls De wang Une Dy stetig, wie man 
leicht unter Verwendung des Axioms (2.1 b) schlieBt. 
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Daher ist auch 0(u,.,, %,—1) 2 fiir n=2, y=0, und da P monoton und linear 
ist, 
(3.20) DEO Up aioe One EO GING 


Wegen der Konvergenz der Neumannschen Reihe fiir alle o€N folgt, wie man 
leicht zeigen kann, 
DP oe 0 mite 1k = cos 


und daher geht nach (2.1e) auch die linke Seite von (3.20), also der erste Sum- 
mand der rechten Seite von (3.18), bei beliebigen n=1 und r=0 mit k-> oo 
gegen Null. 

Nach f) konvergiert die rechte Seite von (3.12) gegen Null. Wir kénnen daher 
wegen (2.1g’) auch immer erreichen, daB die t,, eine Nullfolge bilden*. Es seien 
nun ¢, obere Schranken der t,, fiir m2n—1. Dann kénnen wir wegen t,,—>0 
fiir m-—> oo wiederum nach (2.1g’) annehmen, daB auch die ¢,+0 gehen mit 
n—>oo. Mit 


bey, t, 20 mit n>©o 


n+k—v—1> 


ergibt sich fiir den zweiten Summanden der rechten Seite von (3.18) 


k k 
pa meg hives, 15S) Pit aes D Pt =(E—P)44,70 mit n>. 
v=1 v=1 
Nach (2.1e) geht daher der zweite Summand von (3.18) mit 7— ov fiir alle 
k gegen Null. Hieraus folgt zusammen mit den obigen Betrachtungen und 
(24-5 €) 
lim 0 (u n+r+k>? Un +41) —0. 


n,k—>0oo 


Dav=r(n, k) willkirliche ganze Zahlen = 0 sind, ist das Cauchysche Konvergenz- 
kriterium erfiillt. Daher existiert wegen der Vollstandigkeit von RF ein Grenz- 
element 


(3.21) “= lim u,. 


n—> C&O 


Fiir dieses Element u folgt wegen @(u,,, %4)<o (nach «) und (2.3), (2.1a, c, d, ff 
auf o—o(u,, %) angewandt) auch 


(3.22) 0(u, %) So. 


Damit haben wir zunachst die Fehlerabschatzung (3.8). Es gilt jedoch auch 
die in vielen Fallen scharfere Abschatzung (3.11), aus der wegen ty)= @ (TM, Lp Mo) 
die Abschatzung (3.8) folgt; denn fiihren wir nur einen Schritt ** = Tu, der 
Iteration aus, so hangt der Fehler o(u, ™,) offenbar nicht von den weiteren 
Operatoren J,,, »=1, sondern nur noch von dem Operator T ab. Wir kénnen 
daher fiir die Fehlerabschatzung T,,=T, n=1, 2,..., annehmen und erhalten 
so als kleinste obere Schranke statt t,) die GroBe sae u,) und damit (3.11). 


* Unter der Annahme der Existenz einer kleinsten oberen Schranke fiir die obigen 
beschrankten Folgen in N ware der Beweis ein wenig einfacher mit dem Supremum. 
Wir setzen dies jedoch nicht voraus. 

*x Vel. die 3. Anmerkung, S. 50. 
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6) w= lim u, ist Lésung von (1.1). Denn es folgt aus 


OSe(u, Tu) So(u, Tr) + oT Mn, Tm) 
S 0 (4, Un41) + (Tn Mn, T.¥) + (7,4, Tu) 
SO (4, Uy 41) + PO (Un, 4) + 0(L,4, Tu) 
und anschlieBendem Grenziibergang m—> co nach (3.21) und (3.2), der Stetigkeit 
von P sowie (2.1b, c, e) @(u, ITu)=0, alsou=Tu. 


e) Gabe es zwei Lésungen w und v=-w in G, so ware nach (3.5) 
OSo(u,v)=0(Tu, Tv) S Potu,v)S-:-S P" o(u,»), 


und hieraus folgt wegen der Konvergenz der Reihe (3.9) lim P”"o=0, also nach 


(2.1a, e) o(w,v)=0 oder «=v im Widerspruch zur Annahme, w.z.b.w. 


Wir bringen noch folgenden Zusatz zwm Fixpunktsatz: 


Wird die Existenz einer Lésung u der Gleichung u=Tu in G vorausgesetzt, 
so kann die Forderung (3.2) der gleichmaBigen Konvergenz der Folge {T,,} gegen T 
fiir alle u von G wesentlich abgeschwacht werden. Der Satz gilt bereits nut Ausnahme 
der Eindeutigkeitsaussage, wenn man statt (3.2) nur voraussetzt, daB die Folge {T,,\ 
in dem Punkte u=Tu der Lésung in G honvergiert: 


lim 9 (Tw, Tu) =0 mi u=Tuec. 
Beweis. Der Teil) des Beweises kann genau so gefiihrt werden. Es liegen 
also alle wu, in G. Da auch u nach Voraussetzung in G liegt, gilt 
O(Un41 u) = O(Z, Un» Tu) = o(Z,, %,, T,, 4) fils o (I, u, Tu) 
SPoe(u,,u) +e, u, Tu). 
Durch mehrmalige Anwendung dieser Abschatzung ergibt sich 
k 
(3.23) O(Un+e» u) = PF (tty, u) a 2 tte AGREE U, Tu) Y 
v=1 


Da alle u, in dem durch (3.8) gegebenen Bereich liegen, folgt 
Q (Hn, #4) SO(n, 4) + Q(4,¥) So+e(m,u)=t, TEN. 


Hieraus folgt wegen der Konvergenz der Neumannschen Reihe (3.9) fiir alle 
Punkte von N und nach (2.1 e) 
(3.24) Jim, P¥ 0 (Urry @) = 10: 
Nach (3.7) liegen die GréBen 9,=e(T,,,_,“, Tu) unter einer gemeinsamen 
oberen Schranke: 0, <2{i. 

Da nach Voraussetzung und (2.1b) lim e,=0 ist, existiert wegen (2.1g’ 
nach Vorgabe einer positiven Zahl m eine Zahl N)(m), so daB 

2h 


Cn S fir n=n)(m) und k2yv 
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gilt. Hieraus folgt wegen der Linearitat und Positivitat des Operators P die 
Abschatzung 


k k ~ co 
pS y— 2 fh 2 y—1L ~ 
2P 'OTntnr ts Te) SP Say DP, mB molm). 
Hieraus schlie8t man leicht, daB der 2. Summand auf der rechten Seite von 
(3.23) mit > co gegen Null geht. Zusammen mit (3.24) ergibt sich sodann 
die Behauptung 
lim nO (us, u) =0. 


Die Fehlerabschatzung folgt wie oben. 

Ferner ist folgende Bemerkung fiir die Anwendungen haufig niitzlich: 

Die Voraussetzung (3.2) ist in vielen Fallen fiir die Anwendung des Satzes 
stérend, z.B. in den Fallen, wo der Operator T nicht explizit bekannt ist, sondern 
nur ein Naherungsoperator T. Setzen wir T,,=T fiir alle n, so ist (3.2) nicht 


erfiillt. In diesem Falle konnen wir natiirlich auch keine Aussage dariiber machen, 
ob die Folge u,, m=0,1,2,... gegen eine Lésung w=Twu konvergiert. Das 
wird i. allg. nicht der Fall sein. 

Trotzdem gilt die Fehlerabschatzung (3.11) auch dann noch ohne die Forderung 
(3.2), wenn wir statt dessen (3.5) fordern und wenn (3.8) mit t»=0(TZj,u, IgM) 
und tT=o(TZ;,u%, Fup) erfiillt ist. Beides laBt sich in vielen Fallen zeigen, auch 
wenn T nicht genau bekannt ist. 

Diese Folgerungen ergeben sich aus der einfachen Uberlegung, daB wir, 
wenn wir nur ” Schritte durchfiihren, die Operatoren J} fiir ym uns durch T 
ersetzt denken diirfen, da wir sie ja gar nicht mehr benutzen. Dabei bleibt 
offenbar der Beweis des Satzes unverandert. Somit gilt der 


Zusatz 2: Es gelten die Voraussetzungen A und B aufer (3.2). Ferner gelte 
o(Tu, Tv) S Po(u, v), u,veG, 

mit einem linearen, stetigen und positiven Operator P. 

Liegen dann uy und alle u, fiir die 

@(u, %) S (E — P)* Po (ug, m) + (E — P)*% 

mut einer Grohe T = 0 (Li, M9, Tyo) und T= E(T uo, Lou) gilt, in G und konvergiert 
die Rethe Di P’o fiir alle @EN, so existiert genau eine Losung u der Gleichung 
u=Tu in C und es gilt mit uU,14=T,u,, n=0,1,...,8, die Fehlerabschatzung 
(3.25) @ (4, 4.41) S(E — P)* Po(u,, Ue41) + (E — P)* (LT m,, Hs41) 


fiir jedes S=O. 

Wahlen wir hierin speziell JT, =F, n=0,1,2,..., so folgt wegen u,—Wp 
fiir alle n, da (3.4) erfiillt ist und die Bedingung (3.3) im Beweis des Fixpunkt- 
satzes nur fiir GroBen u, v aus der Menge der u, verwendet wird, der 


Zusatz 3: Gilt die allgemeine Voraussetzung A und 


o(Tu, Tv) S Pou, v), u,veG, 
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mit einem linearen, stetigen und positiven Operator P, liegen ferner Uo und alle u, 
fiir die 
(3.26) @ (ut, Mo) S(E — P) o(T tt, uo) = 6 


gilt, in G und konvergiert schlieBlich die Reihe >’ P’o fiir alle 9@CN, so existrert 
v=0 
genau eine Lésung u der Gleichung u= Tu in G, und fiir diese gilt die Abschatzung 
(3.26). Pree. 
Dieser auch leicht auf andere Weise herleitbare Spezialfall ist ein in vielen 
Fallen sehr einfach anzuwendender Existenzsatz mit Fehlerabschatzung und 


Eindeutigkeitsaussage. 
§ 4. Beispiele 
1. Gewoéhnliche nichtlineare Gleichungen. Nach unserem Fixpunktsatz ist 
es méglich, eine Begriindung und Fehlerabschatzung fiir das bekannte Verfahren 
zu geben, daB man bei der Iteration 


(4.1) Kai (1X) 

die rechte Seite in eine Potenzreihe nach Potenzen von Funktionen 9;(*), 
j=1, 2,..., 8, entwickelt und jeweils nur Glieder bis zu einer festen Ordnung 
beriicksichtigt. 


Sei etwa in einem Konvergenzgebiet x€B, |y,(x)|<c;, die Funktion f(x) 
in eine Reihe der Form 


(oe) 


(4.2) P(%) = De rayey ng (¥) [a (%) 1 [po (*)]* --- [ps (2) 


++ ++ +as=0 


entwickelbar und werden beim u-ten Schritt nur Potenzen bis zur Ordnung 
++ :++-++a,<7, beriicksichtigt, so hat man statt (4.1) das Verfahren 


1S a), > Ay... (x,) [P1 (%,) * Biers [?s Cale 
Or +O.+*** +0%sS%n Ls 
(4.3) =I (X_) — D exe (%n) [Pr (Xn) «++ [Ps (%n) 1 
Or +Oet *** +s 2%y+1 


Mit gewohnlichem Zahlenabstand (|«—y|) hat man dann mit Tx=f(x) in 
der Fehlerabschatzung (3.11) bzw. (3.25) fiir o(T'x,, %,44) die GréBe |&',| einzu- 
setzen. 


1. Beispiel: Gegeben ist die Gleichung* 


4 5 5 Rape ee Oh ere ee 
(4.4) 3 3 RO aha oh oe oe 

Es handelt sich um ein Problem bei der Bewegung eines Satelliten um einen 
Hauptplaneten. Dabei ist 7 der Radius des Satelliten, R im wesentlichen der 
des Hauptplaneten und x der Abstand_ beider Mittelpunkte. Hieraus ergibt 
sich, da x, und R reelle positive Zahlen sind. Daher gilt fiir die gesuchte Lésung & 


* D. VauGHAN [14]. 
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von (4.4): = /3R. Dabei bedeutet & einen kritischen Abstand, unter dem der 
Satellit nicht mehr nur durch innere Gravitationskrafte zusammenhalten wiirde. 

Die Lésung wurde in [/4]* naherungsweise bestimmt, indem x/R nach 
Potenzen von 7/R unter Vernachlassigung der 4. und héheren Potenzen von 7/R 
entwickelt wurde. 


Setzen wir zur Abkiirzung //3=«, so haben wir 


3 
pbs Y 4¥? 57 if? 
r= aR Pit 4 ae | a | pe et A) 
Mit den obigen Bezeichnungen k6nnen wir schreiben: gp, (x) =7/x und @,(x)=7/R. 
Damit haben wir das Iterationsverfahren (4.3). Wahlen wir etwa x,=aR, 
%9= 2,%=2, %,=3 fiir n=2, so ergibt sich nach leichter Rechnung 


2 2 
=r ie \ Y f nie ) 45, ( ' Y 2 ) 
magi (14 ZGR fh 302 RE pinlin? ak (14 3aR a 9a? R2 
und 2 =aR(t Y 2r . B27" 
. ' 3aR Ou2 R2 8103 R3)° 


Das Verfahren kommt zum Stillstand, x, =, fiir ~=3, wenn man sich auf 
die Entwicklung der Lésung bis zur 3. Potenz von 7/R beschrankt. Daher be- 
kommt die Fehlerabschatzung (3.11) bzw. (3.25), wenn wir als Abstand 0(x, &) 
den Betrag der Differenz wahlen, die einfache Gestalt 


| —%|S—5 lh —fla)l, 


1 


wobei hier P eine positive Zahl ist, z.B. das Maximum der Betrage von /’(x) 
und 73 (x) in dem Bereich G. 

Wir wahlen fiir G den Bereich x= /3R und zur Illustration** 7/R=0,01. 
Dann erhalt man nach leichter Rechnung : 


Xe = 1, (x3) =1,44559849R und | /(%3)='1,445-59850R, , sowie P = 0,0024 


und damit das Ergebnis: 


1 


9240, <2 2,005.--10;° 
1 —0,0024 


|E — x,| < 


oder 


E = 1,445 59850 + 2,1-10°%. 


“Offenbar sind alle Voraussetzungen von Zusatz 2 (§3) erfiillt. 
Ein weiteres ganz anders geartetes Beispiel ist das folgende 


2. Beispiel: Es ist die reelle positive Lésung § der Gleichung 
(4.5) 2==A0>C(2) 
zu berechnen, wobei €(z) die Riemannsche Zetafunktion bedeutet: 
1 
(4.6) E(a=)> =. 


* Dort noch ohne Konvergenznachweis und Fehlerabschatzung. 
xx Fiir kleinere Werte von 7/R wiirde man noch eine gréBere Genauigkeit erhalten. 
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Hier ist der Operator T7z=10-€(z) i. allg. nur naéherungsweise bekannt je 
nach der Anzahl der Glieder der Reihe (4.6), die beriicksichtigt werden. Diese 
Tatsache wird durch die gewoéhnliche Iteration z,,,;=7z, und die bekannten 
Fehlerabschatzungen nicht mehr erfaBt. 


Die Reihe (4.6) konvergiert bekanntlich in dem Bereich Realteil z=x21-++6, 
e>0, gleichmaBig und stellt dort eine stetige Funktion dar. Daher liegt wegen 
410 —10-£ (10) =— 0,00995 <0 und 14 — 10 -¢ (11) =0,995 06> 0 eine reelle Losung 
von (4.5) in dem Bereich G: 10S %S11. 

Wir fiihren die Iteration 


Vk 
1 
tus 10- De — ade RO 2 ans 
n=1 


durch, wobei 7, eine nichtfallende Folge natiirlicher Zahlen sei. Wahlen wir 
etwa 75=2, 4 =}3 und 7,=7,=4, so erhalten wir mit %,=10 die Iterationsfolge: 


X = 10,009 765 63 
% = 10,009 867 18 
%3 = 10,009 87600 
%q4 = 10,009875 93. 


Als Abstand (x, y) wahlen wir den gewohnlichen Betrag. Dann erhalt man 
etwa mittels der Abschatzungen 


co 
d ' — logn : log log t z 
oes = et UES . 3 — 
ax Le ¥|<10|2"(x)| 1, or 10> ae f eat <7 AO PB 
q a 4 fiir, x=] 40 


und 


ee copes 10 


[e.e) 


x + f $e] <157-10° fir x=10, 
5 


i 


sowie |%3— %4|<1- 1077 nach (3.11) die Fehlerschranke 
|%_— &| <1,6- 10°. 


2. Systeme nichtlinearer Gleichungen. Eine weitere Anwendung des Fix- 
punktsatzes bieten die in der praktischen Mathematik haufig auftretenden Falle, 
bei denen Gleichungen nur bis auf eine angebbare Genauigkeit ihrer Parameter 


vorliegen. In diesen Fallen ist der Operator T nicht (genau) bekannt. Wir 
wenden dann den Zusatz 2 an: 


Es sei etwa das nichtlineare Gleichungssystem in impliziter Gestalt 


~ 


(4.7) Leas pees Ae) ee) (¢= 4, 2,...,%) 


gegeben, wobei F, andeuten soll, daB die Gleichungen nur naherungsweise vor- 
legen. Wir schreiben zur Abktirzung fiir (4.7) 


(4.8) Gu=0 mit dem Vektor «= (aR XP ieee?) 
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und verwenden zur Lésung z.B. das vereinfachte Newtonsche Verfahren * 


(4.9) Upnsry Se Uy, ae (Gu) 2 Gu, = Tu 


n? 


wobei Con) die an der Stelle %) genommene Funktionaldeterminante von (4.7) 
nach den x/ ist und (G;,,))+ deren Kehrmatrix bedeutet, deren Existenz im Falle 
Giy) +=0 in einer Umgebung* $ der Lésung w von (4.8) gesichert ist. 


Wir verwenden als Abstand ||~—v|| den Vektor, dessen Komponenten die 
absoluten Betrage von u —v sind, und bezeichnen allgemein mit ||A|| die Matrix, 
dessen Elemente die absoluten Betraége der Matrix A sind. 


Die Ungenauigkeit der Ausgangsgleichung (4.8) sei z.B. durch 
(4.10) |G %@) — G mo|| < uo Uy EB 
beschrankt. 

Gilt dann 


|| 2 — T v|| <P||u—v|| und ||Tu—Tr|<P |~ — || in 8 

mit einer positiven Matrix P und dem Operator 
Tu =u — (Gly) 1 Gu 
und kann man auBerdem zeigen, daB (E — P)*+ existiert und der Bereich 
(4.14) I|¢ — || S (EB — P)* [P]|4% — “ll + 70] 
mit T= ||(Gi)) || wo in B liegt, so folgt die Fehlerabschatzung (3.25) mit @ (w, w, 1) 
= ||v — u,.,||. Speziell schatzen wir ab 
||P — Fol| SIG (a5) [Gus (¢ — 0) — (Gu — G »)]]| 
S|] Gta) AI] max |G) — Grell lle — al| 


ue B 
und entsprechend 


Pu — Tall <[log) All max IGlag — tel lle — ol 


und wahlen die positive Matrix P so, daB P || —v|| grdBer oder gleich den rechten 
Seiten dieser Gleichungen wird. 


3. Beispiel: Als spezielles Beispiel soll die nichtlineare Behandlung der 
Matrizeneigenwertaufgabe **: *** Tig, eae 


mit den Matrizen 
0,89689 — 2,01310 0,03082 —1,20201 
unde B= ; 
1,01900 1,49791 1,13810 2,397 92 


* Wir setzen hier alle erforderlichen Stetigkeits- und Differenzierbarkeitseigen- 


schaften der F; voraus. 

xx Die nichtlineare Behandlung von Matrizeneigenwertaufgaben fiihrte m. W. 
H. UNGER [15] zuerst ein. Vgl. ferner L. CoLLatz [8], wo auch Verfahren hdherer 
Ordnung zur Lésung benutzt werden. 

*xx Ohne Beriicksichtigung der Ungenauigkeit der Ausgangsmatrizen kann man 
hier natiirlich die Losungen exakt angeben. Daher kénnte der erste Teil der Rechnung 
fortgelassen werden. Er soll hier nur zur Illustration gebracht werden. Bei Matrizen 
mit mehr Zeilen wiirde man hier auBerdem wegen der einfacheren Rechnung zweck- 
maBig im Banachraum mit Zahlenabstand rechnen. 
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deren Elemente mit einer Genauigkeit von +5 -10°® gegeben sind, durchge- 
rechnet werden. 

Zur Normierung setzen wir die erste Komponente x des Eigenvektors 
gleich 1. Dann ist die Unbekannte wu der Vektor v= ier Mit Gu=Ax—ABx 
folgt 


Gon Gu et 2,013 10 + 1,20201 2 —0,03082 + 1,20201 x) 
. “) \ 4.49791 —2,397924 —1,13810 — 2,39792 x)” 
Als Ausgangsvektor sei die bereits recht gute Naherung #)= te 4 gegeben. 


Dann wird 
G2 & 0,824920876 —0,247 oe eae: Ge 440 ag . 
0,068595906 —0,315061 731 0,000171 416 
Hieraus ergibt sich fiir den Zuwachs 6 und die neue Naherung m: 
. tee 406 Be eS es 406 a 
0,000023767/' —* —\0,728023 767] 


Wir wahlen nun fiir 8 den Bereich 
Ju ml) 10 (1). 


In & gilt nach (4.12) 
Gu a Ge = Cu = Cu * ( 
17 (uo) ( il I (uo) ( | 2,39792 2,39792 
S ee 6,1822\_ 10-4. 
2,9683 12,1343 


45202045 4520204 
0"* 


Wegen der Ungenauigkeit der Ausgangsmatrizen sind die Elemente von l(a.) Giw)|| 
in 8 nach (4.12) um weniger als 1- 10-° gr6Ber. Durch Multiplikation mit l(a) 7 
ergibt sich so fiir den Abschatzungsoperator * 


p — (70072 8,2047\ 404 
1,0756 4,2855 
Nach dem Zeilensummenkriterium konvergiert die Reihe }) P’o fiir alle 


v=0 


o€N. Wir koénnen hier jedoch leicht (E — P)+4 genau berechnen. Man findet * 


(B — pj 1,00021 0,00083 
0,00011  1,00043)° 


Es ist T,=T fiir m=O, 1, 2,.... Daher brauchen wir nur noch || Tuy — T u9\| 
nach oben abzuschatzen, um die Fehlerabschatzung (3.25) anwenden zu kénnen. 
Man findet 

sao spose ie 41\ (1 1,528 
\|G up Uol| = 5-10-8(1-+ Ay) = “107° 
a WNC ane Ces 
und damit * 


[Pty — T wl S| I(Cha) AIG to — Gul] had 10°, 


* Dabei wurde stets nach oben abgerundet. 
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und schlieBlich ergibt (4.11) die Fehlerabschatzung 


Ie sls (Oe 4-64 (10389), goes (16493) sos, 
0,055 0,5898 0,5923 


Dabei ist der erste Summand der Summe eine Abschatzung des Fehlers, wenn 
die Matrizen A und B genau gegeben sind. In diesem Falle hatte man den 
Bereich 8 jedoch noch kleiner wahlen kénnen und wiirde einen noch kleineren 
Fehler ||~—,|| erhalten. Durch die Ungenauigkeit der gegebenen Matrizen wird 
der Fehlerbereich wesentlich vergréBert. Offenbar liegt « in 8. Daher ist die 
Abschatzung giiltig. 


3. Nichtlineare Randwertaufgaben. Bei nichtlinearen Randwertaufgaben bei 
gewohnlichen Differentialgleichungen hat man in vielen Fallen mit Hilfe der 
Greenschen Funktion, falls sie existiert, eine Méglichkeit zu einer einfachen 
Fehlerabschatzung zu gelangen*. Dies ist haufig auch bei der Iteration mit 
verdnderlichen Operatoren bzw. Naherungsoperatoren der zweckmaBige Weg, 
um die Fehlerabschatzung (3.11) durchzufiihren. 


Es sei etwa die spezielle Randwertaufgabe 


sD) aaa ESN AO, 49)), 9 er See ay, eet Ul 9) | — Osu (es Drala g 990) 


gegeben, wobei L ein linearer Differentialoperator ist und i wieder andeuten 
soll, daB die Gleichung nur bis auf eine angebbare Ungenauigkeit vorliegt. Es 
existiere die Greensche Funktion G(x, €) des Randwertproblems 


Li) Sane UO. ll =e; CH MOS Reet) 
Dann ist (4.13) gleichwertig mit der Gleichung 
(4.14) y= fle, EF (E, y(6)) dé =T y. 
Die Ungenauigkeit von (4.13) sei in einem Bereich 8 durch 
(4.15) o (7 (x, v(x), H(%, y(™)) Su 


beschrankt. Dann ist 


Tyan CUE NYE (EN) aE. 


wobei f(x, vy) und also auch Jy nicht (genau) bekannt sind. 


Wahlen wir der Einfachheit halber als Abstand den Zahlenabstand 
0 (, ») = |lee(x) — 0(x) | = max |ee(x) — 0(x) 
und geniigen die Funktionen f und f in & einer Lipschitzbedingung 


lf (x, w) — F(x, v)| SLl|u—o| 


* Vel. L. Cotratz [6], S. 180/f. und J. ScHRODER [10] §§ 3 und 4. 
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mit der gleichen Lipschitzkonstanten L, so konnen wir 


b 
(4.16) Bee ee Mea as 
setzen und die GréBe || T%)— T || durch 

b 
(4.17) | Fe49— To|| sem max {TE é)| dé 
abschatzen. 


4, Beispiel: Als spezielles Beispiel betrachten wir die nichtlineare Schwin- 
gungsaufgabe 


(4.18) yt 4y+styyi=sinx, |y|So,1, 


wobei also y nicht genau gegeben sei. Gesucht sei eine periodische Lésung y (x) 
mit der Periode 2m der ,,erzwingenden Kraft” sin x. 


Hier existiert offenbar fiir die Randwertaufgabe 


y'+4y=r(x), yO)=y(2z), y(0) =9'(22), 


keine Greensche Funktion*. Wir betrachten daher statt dessen das Randwert- 
problem (4.18), y(0)=0, y’ (%/2)=0. Diese Randbedingungen sind hinreichend ** 
fiir die Periodizitat der Lésung mit der Periode 2%. Als Greensche Funktion 
fiir die Randwertaufgabe 

y"+4y=r(x), (0) = y'(S) =0 
findet man 


—icos2*sin2é fir =x 
(4.19) Gn, = 1 Fo 
Sslii 2x cos 26 fir «€ 22%. 
Wir iterieren nach der Vorschrift der Naherungsgleichung 
(4.20) Inst t+ 4¥ny1=— Vatsins, y(0)=y' a = 9; 


und beginnen mit der Lésung yy=4sinx der linearen Gleichung. Man erhalt 
auf diese Weise die Naherungslésungen in der Gestalt 


(4.21) ‘Vee Dy (a, Sins 


wobei also nur Koeffizienten mit ungeradem Index auftreten. Dies gilt auch, 
wenn noch das Glied —yy> hinzugenommen wiirde ***, 


* Fir (x) =sin 2% ist das Problem nicht lésbar. Vgl. auch L.Corrarz [6] S. 25. 

*x FH. EnRMANN [18] S. 133. Dort ist auch gezeigt, daB die Differentialgleichung 

(4.18) im Falle y=O unendlich viele periodische Lésungen mit der Periode 2z 

besitzt. Im Falle y<0 folgt die Existenz mindestens einer Lésung der Randwert- 

aufgabe (4.18), (0) =y’(z/2)=0 und damit mindestens einer periodischen Lésung 
aus einem Existenzsatz von H. EpnHrser [16] S. 451}. 

xxx Fiir yo ist dies richtig, und setzt man (4.21) in die rechte Seite f(y, (x), x) = g(x) 


von (4.20) ein, so gilt wegen der Symmetrie von f(y, x) g(— x) =— fk 

: 2 : , =—g(#) und g(¥-+ 2) = 
—g(x). Die Fourierentwicklung von g(x) enthalt daher nur Glieder mit ae i + : x, 
v¥=0, 1, 2, .... Siehe R. ZURMUHL [17] S. 313f. Diese bleiben bis auf die Koeffizienten 
a, bei der Integration (4.20) erhalten. 
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Man erhalt mit yy=4sin x 


eee a lens norte , 
Yi = Gog Sin * — Zp Sin 3 x = 0,324074074 sin x — 0,001 851 852 sin 3 x, 
WP 091235').. 692891. jt seoeit aPe 
22 43507120. 7303660000 ne * Teresa 
7 . 4 F 
377913600 1 /* + 48498912000 9% 


= 0,324775 266 sin x — 0,001 760125 sin 3 x + 0,6986- 10-5 sin 5 x — 
— 1,85 -10°8sin 7x +0,2-1071°sin 9x. 
Zur Durchfiihrung der Fehlerabschétzung geben wir den Bereich 
B: oS*sZ, |lu—y||S1-10° 


vor. Man findet max |u|<0,3276=u,, und fiir die Lipschitzkonstante L das 
Maximum der Ableitungen von si bzw. f nach uw in 8: 


3ue+|y|-5u4 <0,328=L. 


Weiter ergibt sich fiir die Greensche Funktion (4.19) nach leichter Rechnung 
die Abschatzung 


n/2 n/2 
[\G(%, | d&Saf [|sin2(*+ | +|sin2(x— |] dé =F. 
0 0 
Damit wird P=0,164 und mit || ¥, — y2||<0,0008 sowie 
lf (x, ) — F(x, «) || =|] «8 |]| < 0,4 - u® < 0,0003774 


ergibt (3.25) fiir die periodische Lésung y(x) der Schwingungsgleichung (4.18) 
den Fehler 


lly — vel] = ee | v(x) — yo(x)| S 0,000157 + 0,000452 = 0,000609. 
L452 


Es liegt y in 8. Daher ist die Abschatzung giiltig, und in % existiert genau diese 
eine periodische Lésung y(x) bei beliebigem | y|<0,1. 
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Konstruktion und Durchfiibrung 


von Iterationsverfabren hiberer Ordnung™ 


HANS EHRMANN 


Vorgelegt von L. COLLATZ 


§ 1. Einleitung 


Das Problem der Aufstellung von Iterationsverfahren fiir Gleichungen mit 
einer Zahl als Unbekannte, die mit einer vorgegebenen Ordnung konvergieren, 
wurde von zahlreichen Mathematikern immer wieder erneut in Angriff genommen!. 
Seine Lésung geht jedoch bereits auf LEONHARD EULER zuriick?. Eine geschlossene 
vollstandige Darstellung des unter gewissen Differenzierbarkeitsvoraussetzungen 
allgemeinsten Iterationsverfahrens von gegebener ganzzahliger Ordnung bringt 
E. SCHRODER 1870 [/]. Wenn hier trotzdem noch einmal dieser Problemkreis 
angeschnitten wird, obwohl das Problem der Aufstellung von Iterationsverfahren 
bestimmter Ordnung theoretisch vollstandig gelést ist, so geschieht dies, weil 
die meisten dieser Verfahren fiir die praktische Durchfiihrung zu umstandlich 
und uniibersichtlich sind, so daB man sich bisher in der Praxis im allgemeinen 
auf die mehrfache Anwendung einfacher Verfahren mit kleinerer Konvergenz- 
ordnung beschrankte. Das Fehlen einer fiir die Rechnung handlichen Form hat 
offenbar auch dazu beigetragen, daB die Verfahren héherer Ordnung immer 
wieder in Vergessenheit geraten sind. AuBerdem besteht meines Wissens trotz 
verschiedener Auszahlungen der Rechenschritte? noch keine einfache Entschei- 
dungsméglichkeit, welche Verfahren in speziellen Fallen am giinstigsten sind. 

So wird beispielsweise in der praktischen Mathematik zur Bestimmung der 
Wurzeln algebraischer Gleichungen unter den hier betrachteten Iterations- 
verfahren in den meisten Fallen das Newtonsche Verfahren, also ein Verfahren 
2. Ordnung, bevorzugt. In der Tat erweist es sich fiir algebraische Gleichungen 
bis zum 5. Grade den Verfahren héherer Ordnung tiberlegen. Dagegen ist fiir 
algebraische Gleichungen vom 6. Grade an das Verfahren 3. Ordnung in der in 
§ 3 beschriebenen Form in Bezug auf die Rechenarbeit im allgemeinen allen 
anderen Verfahren der Ordnung k>1 vorzuziehen, was im Folgenden noch 
genauer erklart wird. 


* Diese Ausfiihrungen sind ebenfalls wie eine friihere Veroffentlichung ,,Iterations- 
verfahren mit verdnderlichen Operatoren‘‘ meiner Habilitationsschrift entnommen. 
Auch hier méchte ich den Professoren L. Cottatz, H. Konic und G. Scuutz fiir ihre 
freundliche Unterstiitzung herzlich danken. 

1 Vel. u.a. das Literaturverzeichnis am Schlu8 dieser Arbeit. 

2 Siehe E. BODEWIG [2]. 

3 Siehe z.B. R. Lupwice [3]. 
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§ 2 ist ebenfalls nur als eine Einfiihrung gedacht und bringt neben einigen 
Voraussetzungen und einfachen Folgerungen einige schon bekannte Ergebnisse 
(vgl. [Z]), die hier nur etwas prazisiert werden. Die Ausfiihrungen verfolgen 
im wesentlichen den Zweck, darauf hinzuweisen, daB die immer wieder unab- 
hangig voneinander aufgestellten speziellen Iterationsverfahren hoherer Ordnung 
sich unmittelbar aus allgemeineren Untersuchungen ergeben, die bereits E. SCHRO- 
DER durchgefiihrt hat, und daB die Aufstellung neuer solcher Verfahren keinerlei 
Schwierigkeiten macht. 

In §3 wird trotzdem eine neue Methode zur Aufstellung von speziellen Ver- 
fahren jeder ganzzahligen Ordnung k> 1 angegeben, weil es gelingt, diese speziellen 
Verfahren in eine Form zu bringen, die einerseits fiir jede Ordnung k2}3 die 
praktische Durchfiihrung gegeniiber den bisherigen Methoden wesentlich ver- 
einfacht!, andererseits eine unmittelbare Abschatzung der Rechenarbeit gestattet. 
Uberhaupt scheint bei diesen Verfahren die Rechenarbeit (in bezug auf Multi- 
plikationen und Divisionen) die untere Grenze zu bilden von allen entsprechenden 
Verfahren derselben Ordnung, wie mehrere Vergleiche zeigten, ich jedoch leider 
nicht allgemein beweisen konnte. 

In § 4 werden einige Satze tiber die Rechenarbeit und die Wahl der Ordnung 
fiir die in § 3 aufgestellten Verfahren bewiesen, die eine Entscheidung gestatten, 
welche Ordnung bei speziellen Gleichungen die zweckmaBige ist. 

§5 bringt Fehlerabschatzungen fiir die betreffenden Iterationsverfahren und 
§ 6 schlieBlich einige numerische Beispiele. 

Es sei noch erwahnt, daB sich die aufgestellten Verfahren hoherer Ordnung 
besonders gut fiir eine Ubertragung auf allgemeinere Gleichungen z. B. im Banach- 
Raum eignen, da jeweils nur eine Division [(F’(x,,)) +] erforderlich ist, die dann 
der allgemeinen Lésung einer linearen Gleichung [7,,w=v z.B. mit der Fréchet- 
schen Ableitung 7J;,] entspricht. Dies soll an anderer Stelle gezeigt werden. 


§ 2. Voraussetzungen und einfache Folgerungen 
Zur Bestimmung einer Lésung? € der Gleichung 


(2.1) FeO) 
betrachten wir Iterationsverfahren der Gestalt? 
(2.2), Xp4a = [(4,) = G(X, 1) OG), ea cay. sa1. 4 =O 


Fin solches Verfahren konvergiert fiir alle Anfangswerte x» einer Umgebung 
von € mindestens mit der Ordnung4 k>1 gegen €, wenn 


(2.3) (x) —E=O(|x—E]'), ko=4 


* Bei Rechnung mit elektronischen Maschinen gestatten sie u.a. wegen der ein- 
heitlichen Gestalt eine einfache geschlossene Programmierung fiir jedes R=2 

2 Die Existenz von & setzen wir zundchst voraus. . a 

® Wir schlieBen damit alle Verfahren aus, bei denen im Ausdruck fiir if 
Funktionen wie z. B. F(F(«)) u.a. vorkommen. 


n a : . é 
Der Fall k = 1 macht weitere F allunterscheidungen n6étig. Wir beschranken uns 
hier auf tiberlineare Konvergenz. 


(x) iterierte 
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gilt. Diese Bedingung ist erfiillt, wenn f(x) in einer Umgebung von & Ableitungen 
bis zur k-ten Ordnung besitzt und die Gleichungen 


(2.4) Héy=¢, (6) =7'6,=-:-=(° 2 (=0, &>4, 


erfiillt sind. Ist auBerdem /“ (£) +0, so hat das Verfahren genau die Ordnung? k. 
Die folgenden einfachen Satze sind im wesentlichen bekannt: 


Satz 1. Ervgibt f(x) im (2.2) ein Iterationsverfahren von der Ordnung k>|, 
so hat das Iterationsverfahren 


Xn 11 =F, (%n)'; W—=O, 1; 2,500), 
wober f,(x) die ,,r-fach iterierte Funktion? ist, die Ordnung k’. 


Betrachtet man also 7>1 Schritte des Verfahrens (2.2) als einen einzigen, 
so erhéht sich damit die Ordnung k>1 auf die 7-te Potenz. 


Satz 2. [tir die Funktionen f(x) und g(x) gelte 


f(*) —&=O(|x—§|") und g(x) —§=O(|x —£|*) 
mit ky>1 und ky=1. 


Dann konvergieren die Iterationsverfahren 
Bnei = 1 (8 (Xp) und Wen Ce) n—0, 1, 2, ae 5) 
fiir alle x9 ener Umgebung von & mindestens mit der Ordnung hk, - ky. 


Satz 3. Ergibt {(x)=s, (x) im (2.2) ein Verfahren (k>1)-ter Ordnung gegen &, 
so erhdlt man mit f*(x)=s,(x)+ g(x) das allgemeinste® Verfahren k-ter Ordnung, 
wenn g(x) ene (in emer Umgebung von & eindeutig definierte) Funktion ist, die 
lediglich der Bedingung 


(2.5) g(x) =O (|x — |") 
unterworfen 1st. 


Satz 4. Evgibt f(x) =s,, (x) ein Iterationsverfahren, das mit der Ordnung ki > k>1 
gegen & konvergiert, so 1st 


im Falle FYE) 420) ) haa =3,,(%,) + LE (x,) |" 
k 
im Falle F(£)=0 — %n41 =5p,(%n) + eo 
ein Verfahren von genau k-ter Ordnung?. 
F(x) 


Beweis. Sowohl F(x) im Falle F’(é) ==0 als auch 
eine einfache Nullstelle. Daher ist 


haben an der Stelle & 


F(x) 


F(x) 
JEG) 


|F(x)|* baw. 


j gleich O(|x —é|*), 
1 Diese Ordnungsdefinition geht auf E. SCHRODER zurtck. 
Be Le) fe) eee tie Fis ye a*)) 2» .,%-fach, iterierte- Funktion”. 
3 Im Sinne von (2.3). 
4 Es ist also keine wesentliche Einschrankung, wenn wir uns im Folgenden auf 
die Konstruktion von Iterationsverfahren mit ganzzahliger Ordnung k > 1 beschranken. 


5% 
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aber nicht o(|x —&|*). Zusammen mit 


s,,(4) —& =O (|x — El") = 0(|x — €/) 


folgt hieraus die Behauptung. 

Haben wir bereits ein Verfahren k-ter Ordnung, /(%)=s,(«), so erhalt man 
nach Satz 3 weitere solche Verfahren, wenn man zu s,(x) Funktionen g(x) addiert, 
die (2.5) gentigen, z.B. g(x) = («—&)*. Da aber é im allgemeinen nicht bekannt 
ist, miissen wir g(x) durch die Funktion F(x) und ihre Ableitungen ausdriicken, 
Zh) = [F(x)]* oder allgemeiner g(x) = [/(x) |*p(«) mit einer Funktion (x), 
die fiir x ->& beschrankt bleibt. Unter gewissen einfachen Voraussetzungen tiber 
die Funktion F(x) erhalt man auf diese Weise auch alle Verfahren, die (mindestens) 
mit der Ordnung k gegen & konvergieren. Es gilt der 


Satz 5. Die Funktion F(x) besitze in & eine Nullstelle, sei in einer Umgebung 
von E differenzierbar, und es ser F''(E) £0. 

Ergibt dann (2.2) mit f(x)=s,(x), kR>1, ein Iterationsverfahren k-ter Ordnung, 
das gegen & konvergiert, so erhalt man nut 


(2.6) {*(x) = s,(x) + [F(*)]* 9 (2) 


mit einer willkiirlichen Funktion p(x), die noch von F(x) und thren Ableitungen 
abhangen kann und die fiir x—>& beschrankt bleibt, das allgemeinste1 Verfahren 
k-ter Ordnung, ber dem 1m Ausdruck fiir f(x) die unbekannte GroBe & nicht auftritt. 


Beispiel. Ersetzt man z.B. beim Newtonschen Verfahren f(x) = x — F’ das 


FF ? 
bekanntlich die Ordnung 2 nur bei einfacher Nullstelle € von F(x) [F’(&) +0] hat, 


die Funktion F durch die Funktion (, = S , so erhalt man das Verfahren /, (7) = 
FF’ ‘ 
i aE RT das auch bei mehrfacher Nullstelle von F(x) die Ordnung 2 hat. 


Aus Satz 5 folgt, daB sich die Funktionen /(x) und f,(*) nur durch einen Sum- 
manden /? - p(x) unterscheiden, wobei w(x) im Falle einer einfachen Nullstelle é 
von F fiir *«—>&€ beschrankt bleibt, im Falle einer mehrfachen Nullstelle aber 
nicht beschrankt bleiben kann?. Man erhalt in der Tat eine solche Funktion: 
WEULE 
NOT Seta mera ee 
Beweis von Satz 6. a) Es ist nach dem Mittelwertsatz 


(2:7) E(x) = (w= 2) F(a), & Zwischenwert: 


wobei F’(%) nach Voraussetzung in einer Umgebung von é beschrankt und +0 
ist. Hieraus folgt 


P(x) — & = s,(x) — & + [F(x] p(x) = O(|x — E) +0(\x — €/) =O(\x —E/)). 


Das Verfahren /*(x) konvergiert also mit der Ordnung k>1. 
b) Andererseits muB nach Satz 3 die Funktion /*(x) die Gestalt 


P*(x) = s,(x) + g(a) mit g(x) =O(|x —&|') 


1 Es werden wieder nur solche Iterationsverfahren betrachtet, fiir die (2 3) gilt 
2 Das / nur eine einfache Nullstelle hat, ist Satz 5 hier anwendbar. 
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haben. Es muB also der Quotient 


le(x)| 
|~—é|* 


beschrankt bleiben. Wir kénnen daher g(x) in der Form 
(2.8) g(x) = (x — &)* p(x) 


mit einer fiir x->& beschrankten, aber sonst willkiirlichen Funktion y (x) schreiben. 
Wegen F’(%) ==0 kénnen wir 


(2.9) p(x) = 1 zy] 


fir x—é 


setzen, ohne die willktirliche Wahl von (x) einerseits bzw. von w(x) anderer- 
seits einzuschranken!. Mit w(x) bleibt auch (x) fiir x—€ beschrankt und 
umgekehrt. Aus (2.7), (2.8) und (2.9) folgt fiir g(«) die Form 


g(x) =[F(x)]* p(x), — w.z.b.w. 


Zusatz. Ist F’(é)=0, hat also F(x) an der Stelle € eine mehrfache z. B. p-fache 
Nullstelle (F’(é) =F'(é)=--- =F ®~ (€) =0, F®) (£) £0), so bleibt der Satz giiltig 
und der Beweis unveradndert, wenn man iiberall F(x) durch pile oder durch 
F(x) ersetzt. wg 

Satz 4 und Satz 5 zusammen zeigen, daB man alle Verfahren, die mit einer 
vorgegebenen Ordnung k>1 gegen eine Lésung € von (2.1) konvergieren und 
fiir die (2.3) gilt, erfaBt, wenn man ezm solches Verfahren fiir jedes ganzzahlige 
k>1 angeben kann. Dieses Problem ist, wie schon bemerkt, bereits vollstandig 
gelést.. In geschlossener Form geben E. SCHRODER [/] und spater E. BopEwic [2] 
fiir ein Verfahren k-ter Ordnung (k= 2) im Falle /’(€)==0 die Formel an 


see, Fe (1 dy-41 
(2.10) (@)=*+ Di 1)” -( E. SCHRODER 1869, 


Die WIE Chae Eg 
wobei ( : a) bedeutet, daB der Operator 1 @ +.™mal anzuwenden ist, also 
TE TNE dx 
41 ad eX eae iy d 1 d Caer 
ee: ee =o) ora) de ae 8 (x)) j 


Bei einer mehrfachen Nullstelle  (F’(§)=0) kann man auch hier in (2.10) 


iberall F(x) durch H(x) = Pi 
Da die Formeln mit F(x) statt H(x) im allgemeinen jedoch wesentlich ein- 
facher sind, setzen wir fiir das Folgende /’(£) 0 voraus. 
Fiir die praktische Durchfiihrung der Verfahren werden die Ausdriicke (2.10) 


aber sehr bald zu uniibersichtlich?. Es ist daher fiir die Praxis von groBer 


ersetzen, um die Ordnung & zu sichern. 


1 Man beachte, daB F’(%) bei festem § eine Funktion von ¥ allein ist. 
2 Zum Beispiel erhalt man fiir k = 4 aus (2.10) den Ausdruck 

i 1 Me F3 ( IEE 

f(#) = FE’ 2F% 6F4 3 FE’ 


| ' 


Eine zweimalige Durchfiihrung des Newtonschen Verfahrens erscheint, hier im all- 
gemeinen vorteilhafter. 
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Bedeutung, Iterationsverfahren anzugeben, die mit hoherer Ordnung (k> 2) kon- 
vergieren und deren Durchfiihrung praktisch noch sinnvoll ist. Ferner wird eine 
einfache Entscheidungsméglichkeit verlangt, welche Ordnung in speziellen 
Fallen die zweckmaBige ist. 

Mit diesen Problemen werden wir uns in den nachsten beiden Paragraphen 
beschaftigen. 


§ 3. Aufstellung und Durchfiihrung der Verfahren 
Es gilt der 


Hilfssatz 1. Die nach beiden Argumenten geniigend oft differenzierbaren Funk- 
tionen g,(x, €) und g,.,(x, &) ergeben gegen — konvergente Iterationsverfahren 


Kaas OS) von k-ter Ordnung, k>1, ganz, 
b2W.  Xn414 = Bpril(%,,&) von (k+1)-ter Ordnung. 


Ferner gelte 


Glen e 
(3.4) O8n+s(% 6) =O 
eg ye 
Dann konvergiert das Iterationsverfahren 
Nn —= SRA (ars Sk (Xn, é)) ’ n=O, 1, 2, de. 


(mindestens) mit (k-+1)-ter Ordnung gegen &. 
Der einfache Beweis ergibt sich unmittelbar durch Nachpriifen der Gln. (2.4) 
mut f(x) =8r41 (2, 8x (%, é)). 


Durch Entwicklung von F(&) an einer Nachbarstelle x von & in eine Taylor- 
Reihe ergibt sich 


(3.2) 0=F()=F(x) + (€— 2) F(x) + a i) £. 


2! 


Wir setzen zunachst die Konvergenz dieser Reihe in einer Umgebung U von & 
voraus. Ferner sei in U F’(x) =-0. Dann kénnen wir (3.2) in der Form schreiben: 


G3) §=x-=— ae SS ie = F’""4 th, (F’ £0). 


Ersetzen wir links € durch x,,, und auf der rechten Seite x durch x,, so er- 
halten wir mit 


(3.4) tS e 7 { (E—~x,)? BY l (E—%,)8 Ru ls veh 


2! 3! " 


ein Verfahren, das mit dem 1. Schritt die Lésung € von F(x)=0 liefert, aber 
natiirlich praktisch wegen des Auftretens der GréBe € und der unendlich vielen 


Glieder keinen Sinn hat. Brechen wir die Reihe (3.4) nach dem 2. Gliede (ss 


ab, sO haben wir wieder das Newtonsche Verfahren. Brechen wir sie nach dem 
Gliede mit (€ — Yn)", k= 2, ab, so erhalten wir ein Verfahren (mindestens) (k+ 1)- 
ter Ordnung. In diesem Falle geniigt es, wenn F(x) (k-+1)-mal nach x differen- 
zierbar ist: 
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Satz 6. Es sei F(x) in einer Umgebung U einer Nullstelle € (k+-1)-mal diff 
renzverbar, R=1. Ferner sei dort F(x) +0. 


Dann ist Np Oped Cox ) mut 


em Iterationsverfahren (k-+-1)-ter Ordnung. 


Beweis. Bricht man die Reihe in (3.3) nach dem (k+-1)-ten Gliede unter 
Beriicksichtigung des Restgliedes ab und subtrahiert dann (3.3) von (3.5), so 
ergibt sich 

(E—y)kr1 
Ake 


Sane es — a Sena 
wobei % ein Zwischenwert ist, der in einem Bereich liegt, der x und & enthalt. 
Daraus folgt g,41(%) —€=0 (|x —&|**?), w.z.z.w. 

Nun ist (3.5) wegen des Auftretens von & in dieser Form praktisch unbrauch- 
bar. Haben wir aber bereits ein Verfahren k-ter Ordnung, x,,.,=g,(,), in dem 
der Wert & nicht vorkommt, so erhalten wir nach dem obigen Hilfssatz ein 
Verfahren (k-+1)-ter Ordnung, wenn wir in (3.5) € durch g,(«) ersetzen, und in 
diesem Verfahren tritt dann ebenfalls die GréBe € nicht mehr auf. Auf diese 
Weise ist es méglich, rekursiv Verfahren beliebig hoher Ordnung zu berechnen 
nach der Vorschrift?: 


JEA(GS 
oe f.(%) = % — Foy 
3: F(x) 1 f(il—*2 pn (tele) — 2) yay 
a+1(%) == % F’(x) F’(x) { : 2! Ja) (x) ae “i vg (x), 
R=? 
Man erhalt z.B. auf diese Weise 
F 2p” 
e 7) fs (x) x F’ QF? 
. mul val 1 Jee i 1B f2p’’\2 LA od? F2F” \3 5 
CD) rae a 2 le ey 6 & al nd 


Der Vorzug von (3.6) liegt jedoch nicht in der Einfachheit und Ubersichtlich- 
keit der Methode zur Aufstellung von Iterationsverfahren k-ter Ordnung (k>1, 
ganz), sondern darin, daB (3.6) die Moglichkeit bietet, die Durchfiihrung eines 
solchen Verfahrens k-ter Ordnung fiir die praktische Rechnung sehr zu erleich- 
tern’. Der Grundgedanke hierfiir besteht darin, daB es fiir die Anwendung 
eines Verfahrens k-ter Ordnung nicht erforderlich ist, das Verfahren wie etwa 


1 Vel. auch R. ZURMUHL [5] S. 17. 

2 Multipliziert man die Klammern aus, so kénnten jeweils noch die Glieder mit 
F* und den héheren Potenzen von F vernachlassigt werden, ohne da sich die Ordnung k 
Andert, wie aus Satz 5 folgt. 

3 Dies ist auch der einzige Grund, warum hier die zahlreichen Methoden zur Auf- 
stellung von Iterationsverfahren k-ter Ordnung noch um eine weitere vermehrt 


werden. 
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in der Form (3.7) fiir k=3 oder 4 explizit anzugeben und die einzelnen Rechen- 
operationen an Hand dieser Formeln auszufiihren, sondern man kann die obige 
Herleitung eines solchen Verfahrens in der Rechnung selbst vollziehen: 

Satz 7. Die Funktion F(x) sei in der Umgebung einer Nulistelle & mindestens 
(k+1)-mal stetig differenzierbar mit k=1, und es ser F'(E) 0. 

Dann ergibt folgende Vorschrifi ein Iterationsverfahren, das mindestens mit der 
Ordnung k+-1 gegen — konvergiert*: 

Es sei x, ein Naherungswert von &. Dann berechne man 


1. die Funktionswerte 


1 @F (4, EB Aes 


F, —1 2 Fy 
Mae aa oh , Yn, = pr nt Uma ory , 
"| Lg 2 ane Be dee eek Lge 
Cn kl BF {B r Unk >] 1 Un, k 3| : r Unk ey 
if ! ! 


So wird der neue Nadherungswert 
(3.8) Xn 4-1 = %y = Un k+l : 

Bewéis. Das Newtonsche Verfahren, %,,4.,=h(*,)=*,— ts ist ein Verfahren 
2. Ordnung (wegen F’’(€) ==0), denn man erhalt durch Abbrechen der Reihe (3.2) 


—P"(%) 
2F’ (x) 


(3-9) h(x) —~F= (oa) os OU er) 


wobei % ein Zwischenwert ist, der in einem Bereich liegt, der x und & enthalt. 


Ist %,41=%,+U,,, ein Verfahren r-ter Ordnung fir 2<r<k, so folgt aus 
Satz 6 und Hilfssatz 1, daB 


1 f ve ” vu}, ~ 
—_ \ nv ae nr Fir) 
Xn 44 xy E {i I ai te + t y! i 


ein Verfahren ist, das mindestens von (r+ 1)-ter Ordnung konvergiert. Setzt 
man 7 der Reihe nach 2, 3, ..., k, so ergibt sich die Behauptung. 


Bemerkung. Zur Durchfiihrung des Verfahrens wird offenbar nur k-malige 
Differenzierbarkeit von F(x) in € verlangt. In diesem Fall kann jedoch nicht 
die Ordnung k-+-1 gesichert werden?. 


Fir die praktische Durchfiithrung ist wesentlich, daB die Verbesserungen 
Un it ae 3,...,k, ganze rationale Funktionen von v,, sind, wobei die Koeffi- 
O) ; 


zienten —|— beziiglich y konstant bleiben. Nur der Grad andert sich jeweils 


um Eins. Daher wird man hier zweckmaBig das Hornersche Schema anwenden. 


1 Alle vorkommenden Verfahren konvergieren jeweils in einer Umgebung von & 

. oe . . 
ohne daBG es hier stets ausdriicklich erwahnt wird. 
* Man kann leicht ein Gegenbeispiel angeben. 
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Eine passende Anordnung ist die der Fig. 1. Der Kiirze halber ist dort fiir die 
Verbesserungen v, anstatt v, , geschrieben. Als wesentlicher Punkt in dem Schema 


. . . . (1) 
ist zu beachten, daB in der Folge der Koeffizienten cl = oe LS Owl Saeeen 
die Stelle fiir 1=41, also F, durch 0 zu ersetzen ist! , 


Das Schema der Fig. 1 erweist sich besonders giinstig, wenn F(x) eine ganze 
(1) 
rationale Funktion ist und man zur Berechnung der Funktionswerte a das 
gewohnliche Hornersche Schema benutzt; denn in diesem Fall erscheinen diese 
Funktionswerte gerade an den richtigen Stellen. 


§ 4. Uber den Rechenaufwand und die Wahl der giinstigsten Ordnung 

Um eine Ubersicht iiber den Rechenaufwand der einzelnen Verfahren zu 
bekommen, beschranken wir uns im Folgenden auf das Auszahlen der Multi- 
plikationen und Divisionen und betrachten diese beiden Rechenoperationen in 
bezug auf den Rechenaufwand als gleichwertig. Ferner untersuchen wir nur 
Iterationsverfahren (3.8) nach Satz 7 und Fig. 1. 


Aus dem Schema folgt der 

Satz 8. Gelten die Voraussetzungen des Satzes7 und sei M die Anzahl der 
Multiplikationen und Divisionen zusammen, so sind zur Durchfiihrung eines 
Schrittes bet einem Verfahren k-ter Ordnung mit k= 2 neben der Berechnung der k 
Funktionswerte 


pw 
Ls 1 aah ae tae 


im allgemeinen Fall (FY (ea Oy = 1) 


E&-v 
(R—1)!? E 


3B) BABA) oo 
(4.1) m= 2th 2 


Multiplikationen bzw. Divisionen durchzufiihren'. 
Der Bewets ergibt sich unmittelbar durch Auszahlen aus dem Schema (Fig. 1). 


Folgerungen. Im allgemeinen Fall steigt also der Rechenaufwand beziiglich 
der Multiplikationen bzw. Divisionen quadratisch mit der Ordnung k&. Erhdht 
man stattdessen die Ordnung, indem man ein Verfahren (k*>1)-ter Ordnung, 
z.B. das Newtonsche, mehrfach anwendet, so steigt, wie sich aus Satz 1 ergibt, 
der Rechenaufwand beziiglich Multiplikationen und Divisionen nur wie log k. 
Abnlich verhalt es sich auch mit der Anzahl s der zu berechnenden Funktions- 
werte F., Fi, Fi’, ..., die bei Erhéhung der Ordnung & im ersten Fall, d.h. bei 
einem Schritt mit einem Verfahren k-ter Ordnung mit # linear ansteigt, s=k, 
dagegen bei mehrfacher Anwendung eines Verfahrens (k*>1)-ter Ordnung nur 
logarithmisch mit k anwachst?. 


1 Dabei ist die Berechnung von b= a (s. Fig. 1) nicht mitgezahlt, sondern es 


— n . + Ci - 
wurde jeweils c;b = Se. 1=0,1,...,k —1, als eine Division gezahlt. 
nn 
2 Zum Beispiel ist bei Anwendung eines Verfahrens von der Ordnung k* nach 
dem Satz 1 h* log k 
= a 


lon 
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4 44 Md 
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aa 44 
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| 
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O 
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= 
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Man erkennt hieraus unmittelbar, daB es im allgemeinen Fall (& 0 fiir 
J=1, 2,...) gewdhnlich sinnlos ist, die Ordnung eines Verfahrens beliebig zu 
steigern, da die dabei erzielte Genauigkeit durch einen unverhaltnismaBig hohen 
Rechenaufwand erkauft werden muB, der bei mehrfacher Anwendung eines Ver- 
fahrens kleinerer Ordnung (> 1) geringer ist. 

Unter gewissen einfachen Voraussetzungen laBt sich eine Aussage fiir die 
giinstigste Ordnung machen: 


Satz 9. Es werde die Rechenarbeit fiir die Berechnung der Funktionswerte F(x), 

. FF’ Fe-D : ; ; é 
EAS), ne Me an evner belrebigen Stelle x= x,,1n der Umgebung von & 
als gleich angesehen. Sie mége zur Berechnung eines dieser Funktionswerte der 


Rechenarbeit von a Multiplikationen bzw. Divisionen entsprechen. 
Dann ist fiir 


ol 
Oa fie r~ 14,213 das Newtonsche Verfahren (& = 2) 


und fiir 
a>a* das Verfahren 3. Ordnung 


unter allen Verfahren (3.8) das giinstigste. 


Bemerkung. Dieser Satz kann fiir die Falle als Anhaltspunkt fiir die Wahl 
der Ordnung genommen werden, bei denen sich die Berechnung der Ableitungen 
von /*(x) nicht wesentlich gegeniiber der von /*(x) selbst vereinfacht. Die Grenze 
a* verschiebt sich in vielen Fallen noch etwas zugunsten des Verfahrens 3. Ord- 
nung, also nach unten, wenn man beriicksichtigt, daB die Durchfiihrung des 
Verfahrens 3. Ordnung an Hand der Fig. 1 sehr einfach und tibersichtlich méglich 
ist, was fiir die Berechnung von F(x) und f(x) haufig nicht gilt. 

Beweis von Satz9. Die Anzahl der zu berechnenden Funktionswerte F, 
F’ Fe-» 
Wien (721) | 
Anwendung miissen daher mv Funktionswerte berechnet werden, was nach Voraus- 
setzung der Rechenarbeit von s=anyr Multiplikationen bzw. Divisionen ent- 
v(y-+1) 


bei einem Verfahren v-ter Ordnung (7>1) ist 7. Bei n-maliger 


spricht. Dazu kommen nach (4.1) m= 2| solcher Rechenoperationen 


fiir die m-malige Durchfiihrung des Verfahrens. Wir haben somit insgesamt die 
Arbeit 


A=s+m=anr+—>[P+r—4] 


zu leisten fiir eine Gesamtordnung k=7”, wie sie sich aus dem Satz 1 ergibt. 
Damit wird 

log k 
(4.2) 2logy 


[72+ (2a+1)7—4]. 


Halten wir nun die Gesamtordnung k=2 fest”, so wird die Arbeit A eine 
Funktion von der Ordnung des angewandten Verfahrens allein: A= A(7). 


1 Wir verstehen im Folgenden unter log stets den natiirlichen Logarithmus. 

2 Wir lassen dabei auch solche ganzzahligen k 22 zu, die nicht in der Form 7” 
mit ganzzahligen vy und  geschrieben werden k6énnen und geben in einer Erganzung 
zu dem Beweis eine Begriindung hierfir. 
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Es ist (wenn 7 zunichst stetig variabel angenommen wird) 


dA log k [22+ (2@-+4) 7] logy — fer 4 


dy 2 vy (log r)? 


Hieraus folgt 
ae 10 fiir 7 =>3 (wegen logr > 1 fiir 72 3). 
WA 
Daher ist stets 


A(3) <A(%) fier peed eh 5 e712 


Das bedeutet, daB im Durchschnitt! die Rechenarbeit zur Erzielung einer Gesamt- 
ordnung k fiir alle Verfahren (3.8) mit der Ordnung 7>3 gr6Ber ist als bei An- 
wendung des Verfahrens der Ordnung 3. Es ist daher nur noch r=2 und r=3 
zu vergleichen. Fiir diese Werte wird nach (4.2) 

Eee) 


Ae Sst 
ee und A(3) =logk : 


A(2) =logk 


Hieraus folgt 


ee ; ra = 4 log 2 — log 3 s 
ET sa SO “S 2log 3 — 3log2 ~ jog’ 


Damit ist der Satz 9 bewiesen. 


Ergdnzung. Unter dem ,,giinstigsten“ Verfahren haben wir in Satz9 das 
Verfahren v-ter Ordnung (y=2) verstanden, bei dem man zur Erzielung einer 
vorgegebenen Gesamtordnung k mit der kleinsten Rechenarbeit, d.h. mit der 
geringsten Anzahl von Multiplikationen und Divisionen auskommt. Theoretisch 
kann dabei & eine beliebige natiirliche Zahl >1 sein. Da man bei der Rechnung 
aber nur stets eine ganzzahlige Anzahl von Iterationsschritten durchfithren 
kann und ebenfalls 7 eine ganze positive Zahl (= 2) ist, so erhalt man nur ganz- 
zahlige Gesamtordnungen der Form k=?” bei n-maliger Durchfiihrung eines 
Verfahrens v-ter Ordnung. Ist nun 7,==7, und kommen z.B. in der Zerlegung 
von 7, und 7, in Primfaktoren verschiedene Primzahlen vor, so ist auch stets 
ky=7) = 73=k,, wenn n, und nm, natiirliche Zahlen sind. Um zwei solche Ver- 
fahren mit den Ordnungen 7, und 7, zu vergleichen, haben wir im Beweis von 
Satz 9 auch nichtganzzahlige k zugelassen, die sich also praktisch nicht realisieren 
lassen. Fiir denjenigen, den dieser Weg iiber nichtrealisierbare Ordnungen stort, 
sei zur Begriindung hier folgender Satz angefiihrt: 


Satz 10°. Die Rechenarbeit (an Multiplikationen und Divisionen) zur Er- 
zelung ener Gesamtordnung k=yr" durch n-malige Durchfiihrung eines Iterations- 
verfahrens von der Ordnung r= 2 sei gegeben durch den Ausdruck 


(4.3) A= Q(r)logk, 


wober Q(r) eine Funktion von r ist, die fiir (ganzzahlige) r=2 definiert ist und 
dort positive Werte annimmt. 


1 Siehe FuBnote 2, S. 75. 


2 Alle auftretenden kleinen lateinischen Buchstaben bezeichnen in diesem Satz 
naturliche Zahlen. 
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Es set ferner fiir ein 7,=2 und alle fiir 1,22, 1;-=N, 
O10) = 00) = 9;- 


— wt Ni __ 
=m swi=k; 


Dann folgt aus 


stets 
A, <A,. 


Dagegen existieren fiir jedes j ==1 (natiirliche) Zahlen n, und n, derart, daf fiir 


ea ae 1h = hk; 
ebenfalls 

A, <A, 
gilt. 

Der Satz besagt, daB das Verfahren mit der Ordnung 7, das giinstigste ist in 
dem Sinne, da 1. zur Erzielung derselben oder einer kleineren Gesamtordnung k 
eine kleinere Rechenarbeit erforderlich ist als bei allen anderen Verfahren 7; ==” 
und da} 2. auch mit geringerer Rechenarbeit eine gréBere Leistung, d.h. gréBere 
Gesamtordnung & moglich ist als bei Anwendung irgendeines Verfahrens 7,7. 
Damit ist auch durch realisierbare Falle der Begriff der giinstigsten Ordnung 7 
definiert. Da Gl. (4.2) die Gestalt (4.3) hat, ist damit unser Vorgehen im Beweis 
von Satz 9 hinreichend begriindet. 


Beweis von Saiz 10. Aus Q,< Q; und k, Sk; folgt 


Um den zweiten Teil der Behauptung zu beweisen, wahlen wir eine rationale 


Zahl “+ mit 
nj 


Q; log V5 ss Ny = Qi a Qj log V5 
Q2, logy nN; 20, los? 


was wegen Q; >Q,>0 und 7,, 7; 22 moglich ist. Hieraus folgt einerseits 


m logy, _ log ky = A+; oa Ub also ky > k;, andererseits 
Nj log Vj log k; 20, 

Aj | Opn log ry 4 w.z.b.w. 

Ay QO, 7, logy, ; 


Mit Satz 9 werden die Falle nicht erfaBt, bei denen die Rechenarbeit zur 
Berechnung der Ableitungen F(x) mit wachsendem / abnimmt. Dies ist ins- 
besondere bei Polynomen der Fall. Fiir diese lassen sich leicht genaue Angaben 
iiber den Rechenaufwand machen. Es gilt der 


Satz 11. Bei der Lésung algebraischer Gleichungen n-ten Grades durch Iteration 
nach (3.8) ist in bezug auf die Rechenarbert (Anzahl der Multiplikationen und 
Divisionen) bis zum Grade n=5 das Newtonsche Verfahren und fiir einen Grad 
n>5 das Verfahren 3.Ordnung unter allen Verfahren (y22)-ter Ordnung das 
guinstigste. 
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Beweis. Eine einfache Auszdhlung ergibt bei einer algebraischen Gleichung 
n-ter Ordnung fiir ein Verfahren (3.8) mit der Ordnung 72 2 die Rechenarbeit?+? 


At=9 (m4 1) — 


Bei m-maliger Durchfiihrung eines Verfahrens 7-ter Ordnung haben wir somit 
die Rechenarbeit 


A=mA*=m|r(n +1) —2] 


und die Gesamtordnung nach Satz 1 


Also wird 
logk 
A= eee [y(m +1) — 2] = Q(r) loge. 
Nach Satz 10 ist die giinstigste Ordnung 7 durch diejenige natiirliche Zahl r= 2 
gegeben, fiir die Q(r) den kleinsten Wert hat. Es ist (vy zunachst stetig variabel 
angenommen), wenn k festgehalten wird, 


dA 


$43 y(w+1) (logy—1)+2 
a a : 


) 
y (log 7)? 


fiir r=3 also wegen log 3>1 ao d.h. die relative Arbeit (zur Erreichung 
derselben Gesamtordnung &) nimmt zu, wenn man mit der Ordnung,y tiber 3 
hinausgeht. Als giinstigste Verfahren kommen daher auch hier wiederum nur 
die Verfahren der Ordnungen 2 und 3 in Frage. Es ist 


Daraus folgt 


A(2) = A(3), jenachdem nS 8% ~ 5,885. 


ce Og s 
Damit ist der Satz bewiesen. 

Die Satze 9 und 11 ergeben beide, daB die Verfahren mit einer Ordnung > 3 
unter den getroffenen Voraussetzungen unvorteilhaft sind. Ist F(x) kein Polynom, 
so kann sich jedoch in einzelnen Fallen sehr wohl ein Iterationsverfahren von 
hdherer als 3. Ordnung als das giinstigste erweisen. Dies ist insbesondere dann 
der Fall, wenn sich die Rechenarbeit zur Berechnung der Ableitungen von F(x) 
wesentlich gegeniiber der zur Berechnung von F(x) selbst verringert. Es lohnt 
sich in vielen Fallen, vor Beginn der Rechnung zu priifen, welches Verfahren 
das giinstigste ist. Hierzu bietet der folgende Satz eine einfache Méglichkeit: 


Satz 12. Enispricht die Berechnung von F(x), Fi (a6) 8 zat ae i i 

; 2! > (r—1)! 
“iner ; .., 4,1 Multiplikationen bzw. Divisionen, so 
ist die Arbeit zur Evzielung einer Gesamtordnung k bei Verwendung eines Verfahrens 


einer Rechenarbeit von ay, ay, ap, 


1 Siehe Anmerkung 1, S. 73. 


2 Im Gegensatz zu (4.1) wachst die Rechenarbeit hier nur linear mit der Ordnung k. 


Dabei wurde vorausgesetzt, daB die Funktionswerte F,/s! nach dem gowohmalioken 
Horner-Schema perechnet werden. 
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r-ter Ordnung (Y=2) nach (3.8) und Fig. 1 gegeben durch 


= logk yv(y+1) +2(a)+a,+-::+a,_,)—4 
2; logy ; 
Als giinstigstes Verfahren erhalt man daher dasjenige der Ordnung r=2 (ganz), 
ber dem der Quotient 


| 


+ Qy—1) —4 


(4.4) OS ¥(y+1)+2(ata,t-:: 


seinen kleinsten Wert annimmt. 


Beweis. Bei einem Schritt mit einem Verfahren der Ordnung 7 sind nach 


Barz GL (44) = ao Multiplikationen bzw. Divisionen durchzufiihren. 
Dazu kommen nach Voraussetzung zur Berechnung von ae - (= 0) 27 1) 
Aay+4+:--+a,_, solche Rechenoperationen. Bei  Schritten haben wir somit 
die Gesamtarbeit 


Aan LOE H2 dopey +a, )—4 
2 
und die Gesamtordnung k=?”, also A = aes Q. 


Alles andere folgt aus Satz 10. 
Als Beispiel wollen wir den Fall betrachten, daB die Rechenarbeit zur Berech- 
nung von /(x) an einer Stelle x, in der Umgebung von & a-Multiplikationen 


entspricht, die zur Berechnung der Ableitungen aber nur o Multiplikationen. 


Dann ergibt sich nach leichter Rechnung als das giinstigste Verfahren (3.8)1+ 


das Newtonsche Verfahren fiir ee OAS 
das Verfahren 3. Ordnung fiir 5,019<a< 20,68 
das Verfahren 4. Ordnung fiir 20,68 <a< 117,16 
das Verfahren 5. Ordnung fiir AA AG. 


§ 5. Fehlerabschatzungen? 


Aus der Definition der Ordnung ergibt sich, da8 fiir ein Verfahren k-ter 
Ordnung eine Konstante K, existiert, so daB 


[i(~)—§| 
(5.1) Tea elF SK, 
in der Umgebung der Lésung € von x=/(x) bzw. F(x)=0 gilt. Daher muB in 
jeder Fehlerabschatzung fiir ein Iterationsverfahren k-ter Ordnung in irgendeiner 
Weise eine Abschatzung der Konstanten A, enthalten sein, was im Falle von 
k-mal differenzierbarem /(x) einer Abschatzung der k-ten Ableitung von f(x) 


1 Es sei noch einmal darauf hingewiesen, da8 diese Abschatzungen nur fur die 
speziellen nach Satz 7 durchgefiihrten Verfahren gelten. 

2 L. Cottatz bringt in [4] Abschatzungen, die es ermoéglichen, fur sehr allgemeine 
Iterationsverfahren beliebiger Ordnung k Fehlerschranken aufzustellen. Hiervon ist 
bei den obigen spezielleren Fehlerabschatzungen, die sich nur auf die Verfahren des 
Satzes 7 beziehen, kein Gebrauch gemacht worden. 
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entspricht, die wiederum im allgemeinen von den & ersten Ableitungen von F(x) 
abhangt. Hieraus folgt, daB so einfache Fehlerabschatzungen wie sie etwa fiir 
lineare Iterationsverfahren (k=1) und auch noch fiir quadratisch konvergente 
Verfahren mdglich sind, fiir hdhere Ordnungen nicht erwartet werden kénnen?. 


Wir betrachten auch hier wieder nur die speziellen nach Satz 7 und Fig. 4 
durchgefiihrten Iterationsverfahren k-ter Ordnung. Ferner sei wieder F’(é) +0. 


Nach (3.2) und (3.3) ist fiir k= 3 
(5.2) f=%— 3 at > Gael A + Ry-,9} 


mit 


ul 
k—-1 
# Eee J G=m (E—x,)FFM(E+t(x,—2))dt, also 


Raa < ESA pe FO(ELB(x,—8)|, 0<0<1. 


Andererseits gilt fiir unsere Verfahren k-ter Ordnung nach Satz 7 


E ng Xp)? 
: ; stn n tl wn (r) 
6-4) eat Saag: ap To 
ie 


wobei 
ntl = 1 (%,) 


sich aus einem solchen Verfahren (k—1)-ter Ordnung berechnet, d.h. es ist 


Kn+1 4 g Stil (%,) (%n -, Eee 


mit einer in einer Umgebung von & beschrankten Funktion g,_,(x). Daher gilt 
mit gp 1=8,-1(%,) und k2=3: 


(%n41 ae Ky) = [(%na en é) *T (é eel a 
PING in) AA ae 


Und hieraus folgt mit (5.2) und (5.4) fir k= 


(5.5) %41— = =e x 


Bie 
(Paha Gey ay Ol 4 Bae 
= 


Wegen v21, h23, r22 ist »- (R—2)-+7 
wiederum 


k. Damit ergibt (5.5) und (5.3) 


Xn +1 3 > O (|x, aa é|*) 0 


Die Gl. (5.5) kann nun als Ausgangsgleichung fiir eine Fehlerabschatzun 
dienen : : 


J Die Schwierigkeit besteht hier in der Bestimmung einer méglichst kleinen 


Konstanten K 
a x im (5.1). Ist diese bekannt, so macht die Fehlerabschatzung keine 
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Nehmen wir zunachst den wichtigsten Fall k=3 vorweg, so ergibt (5.5) und 


(5.3) 


=" ee Ron 

P gs Oe eae i = yates 2£0(%, — €)> + g5(*, &)4] E 
(5% ) a: (é—~%,)8 | Fil Ay re 2 (x an é) oe 1 PY 

2F, n 82 n §2 n ns i 


wobei F'”” bedeutet, daB die Funktion F’’’(x) an einer Zwischenstelle zu nehmen 
ist. 
Aus (3.9) folgt 


Se 
Sn oe 
nN 
so daB sich 
SIN aS ames Hie SE meene 
(5.7) X44 ar ge I 4 Fa (Mrg é) I 3 


ergibt. Aus dieser letzten Gleichung folgt nun leicht folgende Fehlerabschatzung 
fiir das Verfahren 3. Ordnung: 


Satz 13. Es existiere ein Bereich 8, in dem folgendes gilt: 
a) |F'(x)|2m>0 und |F!(x)| <M, 


mut Konstanten m und M,, 1=2, 3. 


ro) nae 
B) all <¢ 
nut emer Konstanten c. 
yy eS Set 
2 Ce ee Vee eV seers 
Ket<= 1° mit K ==, |mM; += M, c+ ; m M,] . 


Liegen dann alle x mit 
(5.8) |x — x»| = 2¢ 


in %, so konvergiert das Iterationsverfahren (3.8) (Satz 7) fiir k=3 gegen die einzige 
Lésung & von F(x) =0 in 8 und es gilt die Fehlerabschatzung 


(5.9) Denar es ae yee t= Othe d eon « 


Beweis. Wegen «) und f) existiert genau eine Nullstelle € von F(x) in %, 
und es ist sogar 


(5.10) ea esate” 
Es gelte |x,, —&|Sc fiir n=0, 1,..., 7. Dann liegen wegen 
Jey — ol S| — | + ny — 6] S2¢ 
diese x, in 8, und es folgt aus (5.7), «) und y) 
Ms 


ee wie + | = K|x,—&° 


f 4m? 3 


41 
3 
ii <| =|% | 2m 
SS Ger, 
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Daher liegen alle x, in dem Bereich |x —&|<c von % und es gilt 


. 1) Oe tees 


(5.11) | Spat ak | te rate 


Wegen K|x,—é|?SKe?<1 konvergiert das Iterationsverfahren, und durch 
mehrmalige Anwendung von (5.11) ergibt sich mit (5.10) die Fehlerabschatzung 
(5.9), wie man auch leicht durch vollstandige Induktion nachpriift, w.Zz.b.w. 

Wegen F’(é) +0 laBt sich offenbar stets ein solcher Bereich 8 angeben, der 
die geforderten Bedingungen erfiillt, wenn nur x) nahe genug bei & liegt’. Daher 
ist die Fehlerabschatzung immer durchfiihrbar. 

Fiir die Verfahren (3.8) der Ordnung k>3 wird die Bestimmung der Kon- 
stanten K, in (5.1) etwas miihsamer. 

Aus (5.5) und (5.3) folgt wegen »- (k—2)+r2v+k—1 fiir v21, 722 und 
k=3, wenn wir bereits wissen, dab Boe —é| ec irist =, 


Aiba (C= ae pes r(k) 
Hine — 6] Se LES (Seka lee —€0} + gree ome 
| in| =o =A a in | 


= k-1 r [-(k) 
eit ee Pe eer e [EA ter k 
— |E | [(1 I eel %, é|) 1) a y! k! |Fy| 1% 5) ‘ 


(5.12) 


Dabei bedeutet F“), daB der Funktionswert von F(x) an einer Zwischen- 
stelle zwischen x, und € zu nehmen ist. Die Summe 


Sia 


k-1 Sf Sit —* 
=y Efe) ran Te Tn ress Pee ee 
y| 51 eae hea (CES 


r=2 
kann unmittelbar aus dem Schema (Fig. 1) entnommen werden. Die Gl. (5.12) 
liefert eine Rekursionsformel zur Abschatzung der GréBen g,=g,(x,): 


Sea 


(543) ler Sopp FEE [+ Leal lee — EN — 1] 4+ FON, res. 


Hieraus ergeben sich mit 
(Seta TEC) = Oa Os Me ee a 


die Konstanten K, in (5.1) rekursiv aus der Formel 


645) KF Kale] +, tes, 


m \|%,—€| 


ES 
wobei S#, = 51 und K, = ist. 
rane 2m 
Analog zu Satz 13 ergibt sich damit der 
Satz 14. Gelten in einem Bereich & die Abschatzungen (5.14), asd IF @o)l 0" 
. . Ue i 
legen ferner alle x mit |x —x \|<2c in B und gilt K,c*+<1, wobei sich K, 


1 In di F j ; re 
ate ae iesem Falle muB jedoch die Existenz der Lésung & von F(x) = 0 vorausgesetzt 

2 Dies ist offenbar der Fall, wenn |F’ > ' 
|y—4,| Se gilt. ni (3)| ean Oran |F(x,)|Scm<m in 
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vekursiv aus den Formeln 


616 K=%, K=2(Sfa+K, 94-1474, ssise, 


2m m 


berechnet, so konvergiert das Verfahren (3.8) k-ter Ordnung gegen die einzige Losung & 
von I(x) =0 in &, und es gilt die Fehlerabschatzung 


eel 
(5.17) ge AG ree Ty Ore, Aas 


Der Bewets ist véllig analog dem von Satz 13. Auch hier existiert wegen 
F'(&) +0 stets ein Bereich 8, der die geforderten Bedingungen erfiillt. Wegen 
c<1 kann man die 2. Gleichung in (5.16) auch durch  / 
die grébere Rekursionsformel e 


K,=2{sti[u+K 4-114}, 3sise, 


ersetzen. 


§ 6. Beispiele 

1, Beispiel. ef’ =1+2, 2=x-+ yi +0. 

a) Als Naherungswert fiir eine Lésung ¢ ergibt sich 
aus der Zeichnung (Fig. 2) als Schnitt der Kurven 
gleichen Betrages und gleichen Winkels! der Wert 
Geet 7; 54. 

f) Entspricht die Berechnung von f,=e”"—z,—1 
und —1/Fy der Rechenarbeit von a=a,+a, Multi- 
plikationen (komplexer Zahlen) und vernachlassigt 
man dabei die Arbeit zur Berechnung der Zahlen? 
F)/s! (s= 2), so ergibt sich nach Satz 12 als die giin- 
stigste Ordnungy diejenige, bei der der Quotient (4.4) 


Sei & SS & FS BS SG GS 


| | 
SS SS 


Cs 


! | | 
(6 1) om y(y+1)+2a—4 Se UP UE Ib te SS 


~4 


log Y Fig, 2. Erlauterung zum 1. Beispiel 


seinen kleinsten Wert? annimmt. Es ist also das Verfahren der Ordnung k=? 
(y= 2) giinstiger (ungiinstiger) als das Verfahren der Ordnung k=rv+ 1, wenn 
Q (rv) kleiner (gr6Ber) als Q(7-+-1) ist, woraus nach (6.1) 


aati. 2) = Allosr (77 aoe (7-1) G(r) 
D log (y+ 1) — logy 
folgt. Es ergibt? sich fiir 


< 
@ (5) 


pee een es ie he i es a 
G(r) =4,129 | 11,275 | 23,063 | 39,966 | 62,360 | 90,586 | 124,902 | 165,526 


1 Beide Kurven lassen sich leicht punktweise mit Hilfe der Kreis- bzw. Geraden- 
schar durch den Punkt (—1, 0) konstruieren. Sie sind symmetrisch zur x-Achse. 
2 Diese lassen sich etwa fiir s <10 unmittelbar fortlaufend hinschreiben. Wesent- 
lich zur Berechnung der Funktionswerte &/s! ist hier in bezug auf die Rechenarbeit 
nur die Berechnung von en = 67 (COS Yy+1 SIN Vx). 
3 Die Basis des Logarithmus ist dabei beliebig > 1. 
4 Tn der Praxis wiirde natiirlich hier eine viel grébere Schatzung genigen. 


6* 
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Ist also z.B. a<4,129, so ist das Verfahren 2. Ordnung giinstiger als das 
3. Ordnung; ist a<11,275, so ist das Verfahren 3. Ordnung giinstiger als das 


4, Ordnung usw. 

Die Wahl der Ordnung hangt hier wesentlich davon ab, welche Genauigkeit 
erzielt werden soll. Fiir gréBere Genauigkeiten werden die itblichen Tafeln im 
allgemeinen nicht mehr ausreichen, und man hat die Funktionswerte (insbesondere 
e) selbst zu berechnen. Daher wird man in diesem Fall zweckmabig ein Ver- 


fahren héherer Ordnung wahlen?. 


Tabelle 1. Itevationsverfahren k-tey Ordnung %,=%)+U, zur Bestummung 


ep 
1,415341 38 +3,82993368% 
FEN | 0,04390237—0,032443 961 


3! } 
0,471 78046+1,276644 561 | 1,45924375+3,797489721 


FO (2) 


4! 
0,11794512+0,319161 147 


| 
0,010975 56—0,00810316% | 0,04346772—0,032 744917 
| 


0,482 75602+1,26854140i7 | 1,45880910+3,797188771 


F()(z5) és 
ters 
0,023 589.02 +-0,063 832237 


| 0,002 19505—0,001 620607 | 0,01088833—0,00816948i | 0,04346482—0,032 740271 


0,12014017+0,317540541 | 0,48266879+1,268475087 1,458 806 20+ 3,797 193417 


y) Wir fiihren hier die Verfahren bis zur 6. Ordnung durch (Tabelle 1). 
Dabei wurde 8-stellig gerechnet, um Abrundungsfehler zu vermeiden. Diese 
k6nnen sich hier nicht aufschaukeln, wie man sich leicht an Hand der Rechnung 
itiberzeugt. Geht man mit der Ordnung & iiber 6 hinaus, so 4ndern sich die v, 
nicht mehr innerhalb der Genauigkeit von 8 Stellen nach dem Komma: 


Vv, = Ug + 0,5 - 1078. 


Mit 21=% + v, und z9= 2,1 + 7,57 erhalten wir somit die folgenden Ergebnisse 
bei einem Schritt mit dem 


Verfahren 2. Ordnung (NEWTON): z, = 2,0882059 + 7,462021 77 
Verfahren 3. Ordnung: % = 2,088 8215 + 7,461 48017 
Verfahren 4. Ordnung: 21 = 2,088 843 0 + 7,461 488 27 
Verfahren 5. Ordnung: 2 = 2,088 8430 + 7,461 48927 
~ Verfahren 6. Ordnung: 2 = 2,088 843 0 + 7,461 48937. 


1 Wegen der einfachen geschlossenen Programmie ilt di 
s : g rung der Verfahren gil 
bei Benutzung einer elektronischen Rechenanlage. i ios athe 
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6) Eine grobe Schatzung l48t erwarten, da8 fiir den Konvergenznachweis 
und die Fehlerabschatzung nach Satz 14 der Bereich 
(6.2) Bi: |2—29| = 0,1 
die geforderten Bedingungen erfiillt. Aus (6.2) folgt mit z=x-+7y 


2,0 5% = 2,2)| und daraus_ |F’(z)| =|e*—1| = |e*| —1=e*—1, 
7455766 | also |F’(z)| 2e— 1=6,389 =m, z€B. 


einer Lisung dey Gleichung F(z) =e? —z—1=0, (%=2,1+7,52) 


a 


Fe) 
Tava — 0,029 51526+0,123496 527 
—0,269 317 25-++0,159867 377 Vo= —0,011 794 10 —0,03797827% 
10) 
§0,005275 55—0,00372344i 
0,128 761 58 —0,098 922841 | —0,274 59280+0,156143937 p= 0,014 178 $50,038 19884 
—0,005 25322 —0,003 903424 ie 
0,129 966 62 —0,098 660 321 —0,274 $7047 +0,15596395% Vy= — 0,011 15699—0,038 511 817 
—0,005 245 18 —0,003 905 547 7 
0,129 96069 — 0,098 546 587 | —0,274 $6243+0,155961 837 & scans) 15696 —0,038 510767 
—0,005 244 96 —0,003 905 28% E 
0,129 95696 —0,098 544877 —0,274 56221 +0,155962097 Vg= —0,011 157 00 —0,038 5107474 
Weiter wird JF l}l Lah (AO OOS 


und damit gilt |z—z)|<2c in &. 
Ferner ergeben sich unmittelbar die Abschatzungen 
EN) ae he aneht2 — 0,025,013 5 9.0254 = Mi el 28) 
in %, und hieraus rekursiv aus der Formel (5.16) folgende Konstanten K, bei 
den Verfahren der Ordnung: 
6.3) die Aley eee te ee We Oe 
K,= 0,70631 | 1,2508 | 3,8183 | 20,2544 | 648,556 


Es folgt K,c’1<1 fiir k=2,3,...,6. Daher konvergieren diese Verfahren. 
Unter Verwendung der Konstanten K, ergeben sich jeweils nach dem m-ten 

Schritt aus der Fehlerformel (5.17) die Schranken fiir das Verfahren 

2. Ordnung: |z, — ¢| S 1,42 (3,532 - 1072)” 

3. Ordnung: |z,, — ¢| S 0,895 (5,592 - 10-*)*" 

4. Ordnung: |z,, — ¢| S 0,639 (7,830 - 10°)” 

5. Ordnung: |z, — ¢| S 0,472 (14,0608 - 1072)" 

6. Ordnung: |z, — ¢| $0,274 (1,8255 - 1074). 
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Noch genauere Fehlerschranken erhalt man, wenn man die Fehlerabschatzun- 
gen von Satz 14 erst nach dem ersten Schritt durchfithrt. Fiir den Wert z= 
2,088 843 0-+ 7,461 48937 des Verfahrens 6. Ordnung ergibt sich dabei unter Ver- 
wendung des neuen Bereiches 8, , |z — %,| $107, ein Fehler von [z,—¢|<0,15-107% 
z, ist also noch in den letzten Stellen genau. 

2. Beispiel. F(x) = x7 + 5 x8 4-3 x? 4 2x4 + 4x8 1227+ 6%4+1=0. 

Es ist F(— 1) = —1 und F(—0,5) =+1,1016. Daher liegt zwischen += — 1 und 
x—=—0O,5 eine reelle Nullstelle von F(x). Wir wahlen x)= W— 0,75. 

Nach Satz 11 ist hier das Verfahren 3. Ordnung das giinstigste. 

Zur Veranschaulichung der Verfahren wollen wir hier trotzdem das Schema 
der Fig. 1 iiber k=3 hinaus weiterrechnen. Wir erhalten so die Tabelle 2 und 
damit das Ergebnis nach einem Schritt bei dem 


Verfahren 2. Ordnung (NEWTon): x{? = — 0,6765992 
Verfahren 3. Ordnung: x8) — — 0,6825957 
Verfahren 4. Ordnung: x{) = — 0,680 7081 
Verfahren 5. Ordnung: x) — — 0,680993 5 
Verfahren 6. Ordnung: x{) — — 0,6809586 
Verfahren 7. Ordnung: x =- — 0,6809626 
Verfahren 8. Ordnung: x\®) — — 0,6809622. 


Bei Weiterrechnung des Schemas ergibt sich durch die Verfahren 9. und héherer 
Ordnung innerhalb der Rechengenauigkeit von 7 Stellen keine Anderung mehr. 

Fihren wir statt dessen zweimal das (giinstigste) Verfahren 3. Ordnung durch, 
so erhalten wir (mit x)= — 0,75; *%,=—0,682595 7) den Wert x,= — 0,6809622, 
also denselben wie bei einem Schritt mit dem Verfahren 8. Ordnung. 

Es ist F(— 0,680 962 2) = 4,4 - 1078, also | F(x!))| <5-10-8. In dem Bereich 8: 
— 0,681 S *S — 0,680 ist |F’(x)|>5,8=m. Es folgt 

Yaa) 9 40-8 Aa 
m 5,8 

Damit haben wir das Ergebnis 


€ = — 0,68096220 + 1078. 


bla ; rae Sen: 
Fir die GréBen ee ergeben sich in dem Bereich 8 die oberen Schranken 


M,_, M. M. M, : 
i om ah = 12, a = 16, aT = 8 (HO) (ahi x€%). Damit erhalt man 


(mit c=10°) nach leichter Rechnung aus (5.16) und (5.17) 


die Konstanten! und _ die Fehlerabschatzungen 


Ky =0,5173 [%n — &| S 1,93 [0,52 - 10-82” 
Ke 2.61 |x, — | S 0,62 [1,62 - 10-8]” 
K,= 23,1 |, — €| S.0,36[2,85 - 10-8] 
K,; = 493,9 |x, — €| S 0,22[4,72 - 10-8)" 


fiir die Iterationsverfahren 2. bis 5. Ordnung, wobei X%9 = — 0,680 962 20 gesetzt ist. 


* Die verhaltnismaBig groBen Betrage der Ableitungen F?(x) bei diesem Beispiel 


wirken sich auf die Konvergenz und die Abschatzungen bei héheren Verfahren un- 
gunstig aus. 
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A Characterization of Hypergeometric Functions 


N. CHako & J. MEIXNER 


Summary 


A theory of special functions should derive as many of the numerous formulas 
and properties as possible from some guiding principles. One of these principles 
is the /-equation, which TRUESDELL has put forward, and which is satisfied by 
all simple special functions. Many results about addition theorems, generating 
functions, integral representations etc. follow immediately from the F-equation. 
One disadvantage, however, is that the f-equation does not constitute a specific 
property of the simple special functions, generating instead functions of a much 
more general character. 

By assuming two functional relations one of which can be transformed into 
an ascending and the other into a descending F’-equation, one obtains as solutions 
of these functional relations the hypergeometric functions with all their special 
and confluent cases, and thus one has a new characterization of the hypergeo- 
metric functions. 


1. Introduction 


By the simple special functions of mathematical physics we understand the 
hypergeometric functions with their special and lhmiting cases, examples being 
Legendre functions, Bessel functions and confluent hypergeometric functions. 

A common property of these simple special functions is that if they are written 
in appropriate variables, they become solutions of linear homogeneous differential 
equations of second order with polynomial coefficients. But this is a property 
common also to other special functions, such as Mathieu and spheroidal functions. 

Another common property is the existence of linear three-term recurrence 
relations between three contiguous functions, where contiguous functions are 
defined as those differing by one in some parameter. The coefficients in these 
recurrence relations are polynomials in the independent variable and in the 
parameters, if both are suitably defined. But without specifying further the 
nature of the coefficients, these recurrence relations do not characterize of the 
simple special functions; such relations also hold true, for instance, for the 
Fourier expansion coefficients of Mathieu functions. 


TRUESDELL* has drawn attention to the fact that the simple special functions, 
after appropriate transformation, satisfy a functional equation of the form 


BE = Fe, 0 +4) aa IC NS a Bie: ee (1) 


* TRUESDELL, C.: An Essay toward a Unified Theory of Special Functions. 
Princeton University Press 1948. 
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which is called TRUESDELL’s F-equation. This property (1) is remarkable and 
powerful because it permits one to derive in a brief and straightforward fashion 
many theorems for simple special functions; in particular, addition theorems, 
generating functions, integral relations. But this /-equation 1s not a characterizing 
property of the simple special functions either, since the generalized zeta function 
C(a,z), after multiplication by e’*"J"(a), satisfies (1) without belonging to the 
functions of hypergeometric type. 

However, the power of functional equations like (1) can be applied to a 
characterization of the simple special functions, if one recalls that the simple 
special functions always satisfy two simultaneous functional equations of the 


types dy (z,a) 


=U izay@etUaay@eo+), 2) 
beats = U,(z,x) y(z,a) + Vo(z, a) y(z,% —1). 3) 


By themselves, these equations do not give a sufficient restriction on the 
possible solutions of (2) and (3), so long as we do not stipulate additional con- 
ditions. We require therefore, that there exist functions z(&,;) and ®; (z(&,), a), 
*=1,2, such that the functions Y,(é;, «)=@®,(z(é,),«) y(z(é,), a) satisfy the 


ascending /’-equation DV AE, a) 

are Ss Se") 
and the descending F-equation 

dY, (Ss, &) 

ae = Y, (ea ,%— 1) r 


Even so, too much arbitrariness remains, and therefore we require in addition 
that there be two linearly independent solutions of (2) and (3) with the above 
mentioned properties. 

There is no loss in generality if we assume U, (z, x)= 
simply means that we transform the equations (2) and (3 
as new dependent variable. 


0, UYi(z,«)=1, which 
) by taking ¥i(&, a) 


Changing the notation slightly, we therefore seek functions y(z, Oia 
% +1, %+2,..., with the following properties*: 


1. y(z, a) is a solution of the ascending F-equation 


a , 
rae De et) (4) 


2. There exists a function @(z,«) and a variable £=&(z) with d&/dz-0 in 
some domain of the complex variable z such that 


y (E, 0) =@ (2 (6), «) y (z (6), «) (5) 
is a solution of the descending /*-equation 
dY (E,0 
oe) _yig,a—1). (6) 


3. There exists a second function y, (z, «), which is linearly independent of 
y(z, «) and has the same properties 4. and 2. 


* This is a generalization of a problem which TRUESDELL indicated in Theorem 6.1 
of his monograph. 
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2. Derivation of the general solution 
We note first the following 
Lemma. If y(z,«) 7s a solution of the ascending F-equation, so also is 
R*y(kz+1,a+a). 
If Y(é,«a) ts a solution of the descending F-equation, so also is 
kR“Y(kRE+1,a+a). 
Here k,l, and a are arbitrary constants with the restriction k +0. 


The proof of this lemma is elementary. 


In the following considerations, for simplicity of notation, we often omit 
the variable z from the arguments of the functions y(z, «) and D(z, «). A prime 
means differentiation with respect to the variable z. 


By inserting (5) into (6), we obtain the equation 


[®'(x) y(@) + (a) y'(a)] Se = Oe. — 1) yw — 1). (7) 


The equations (7) and (4) are not compatible unless some conditions on the 
functions ®(«) and z(&) hold. To derive them, we replace « by «—1 in (4) and 
by «+1 in (7). Let us denote the resulting equations by (4’) and (7’). Then 
we eliminate y(«—1) from (4’) and (7) and y(«+1) from (4) and (7’). This 
elimination results in two linear and homogeneous differential equations of 
second order for y(z, «). They are 


["(a) y (2) + 2B'(2) »'(a) + Pla) ¥"(0)] Ge + 


Zz “(a— Zz (8) 
+ [®(2) 9 (a) + Oe) »'@)1 | (Ge) - “Geary ge] = P19), 
[Bla + 1) y"(a) + O(a +1) »'(@)] Se — Gla) y(a) =0. (9) 


Since both differential equations are satisfied by the same function y(z, «) 
and by the same linearly independent function y,(z, «), they must be identical. 
By comparing their coefficients, one therefore obtains the following two equations 
for ®(«) and z(€): 


@'(x-+1) @'(a) | (a1) (dz/db)’ 

CG ean OG Sade. 2 (10) 
@'(x) dz | O(a) a (2s) P(e) Wot) dz | Me) A—1) gy) 
Bie) dE’ OG) ded?) G(x) Oaa1). df | Gleti) O(c) °° 


The first equation constitutes a linear difference equation in « of second 
order for the function ®’(«)/®(«), which is solved by a polynomial in « of second 
degree, o’ i : ; 

Dy = Poe) +a Pile) +0 Pale), (12) 


a 


with coefficients £o(z), £1 (2), £3(2) which may depend on z. Now the integration 
with respect to z can be performed. It gives 


D(x) = (x) exp [bo (2) + & Ar (2) + &* bo (2)]. (13) 


The factor g(a) is the integration constant and thus depends only on «. 
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Due to (12), the first three terms in (41) form a polynomial of at most fourth 
degree in «. Considering (11) as a difference equation for P(x)/P(a+1), one 
observes that this expression has to be a polynomial of fifth degree or less in &. 
On the other hand, one obtains from (13) 


P(x) q (%) 
Batty = Gari sPl— A) — 2a +1) p2(@)], (14) 


which is a polynomial in « for all z, only if #,(z) is a constant. Without loss of 
generality, one can put this constant equal to zero by redefining g(a) as the 
q(«) in (13) multiplied by exp (ay). 

Thus, putting , (z) =0, one concludes from (12) that ®’(«)/@®(«) is a polynomial 
of degree at most one in «, and therefore the right member of (10) vanishes. 
This is equivalent to 2’s being a linear function of & and vice versa. By the 
lemma, one can restrict consideration to the special case z= and then arrive 
at the general function Y(&,«) connected with y(z,«) by the transformation 
given in the lemma. 


What remains now is the discussion of equation (11). Making use of (43), 
of 6.=0 and z=, we simplify (11) to the form 


bo (2) + Bo(2) Pi (2) + & [PY (2) + £1 (27) + 


a gC 15 
F ea aoe SSP ATES oe 


On concludes from this equation that ¢(«)/qg(«+1) is a polynomial of at most 
the second degree in «, namely 


— ey =o ta+na(at4) Ce 


with constants coefficients gj, s,, 72. Inserting (16) into (15) then gives 


Po (2) + bol) Pi (2) = s,exp[— Ar (2)], (17) 
px (2) + i (2)? = 27, exp[— py (2)]. (18) 
The solutions of these differential equations are 
: P Sots, Zz 
P=n(m+nz+72), p= eH (19) 
with new constants 7%, 1, So. 
By use of (12), (14), (16), (19), the differential equation (9) becomes 
(% + 2 + 7227) y'"(z, 0) + [So + Sy 2+ (a + 1) (%1 + 2722)] y" (2, 0) + 
(20) 


+ [Go + 810+ %2%(% + 1)] (2:0) =0 


with arbitrary constants 7%, 7,72, So, $1, 9%). This is a differential equation of 
hypergeometric type. The same differential equation may be obtained from (8) 
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3. Discussion of the solution 


While it is clear from (20) that the functions which satisfy the postulates 
mentioned in Section 2 are hypergeometric functions, including their special and 
limiting cases, it is worthwhile to give explicit expressions for y(z, «), O(z, «), 
Y(z, a) in familiar notations, because, by TRUESDELL’s results, to exhibit such 
expressions is tantamount to giving explicit generating functions and addition 
theorems for the various simple special functions. 

We must distinguish several cases according to the character of the poly- 
nomial coefficient 7)+-72+7227. It can have two different roots, two equal 
roots, one single root (7,=0), or none at all (7,=7,=0, 7) +0). 

In each case the procedure is to give a suitable solution of (20) in terms of 
the conventional notations of the simple special functions, to multiply it by 
a factor which depends only on « such that (4) is satisfied — this is then the 
y(z, a) — to evaluate g(a) from (16) and ®(z, «) from (13), and finally to write 
down the Y(z, «) according to (5). 


Case 1. The polynomial 7,+7,z+ 7,27 has two distinct roots, which can be 
assumed to be at 20 and 2=4 (see the Lemmia); that is, 7,=0,°7,=— 72. 
Furthermore, one can assume 7,=1. For convenience So, S,,% are expressed 
by other constants a, b, c in the following way: 


S—G--0—-A) -a5=40, Sy=i—e. 
Then the differential equation (20) reads 
z(z—1) y"(z,a) +[(@+ 6+ 2a+ 1) z—(c+a)] y'(z, a) + 
+ (a + a) (6 + a) y (2, 0) =0. 


This is the hypergeometric differential equation in normal form with the para- 
meters ata, b+a, c+ta. 


(21) 


From (16) one obtains 
(us 


1+) = Fata O+e) ' 2 
apart from a trivial constant factor, which can be omitted. (19) gives 
pi (2) =In[z(z — 1)], 
(23) 


exp pole) = 2°? (2 — 1), 


again omitting a trivial constant factor. Inserting these results into (13) leads to 


P(x) ES aie paces gete-d (1 a. pease sca (24) 


up to a constant factor. 
Not every solution of the differential equation (21) is a solution of the as- 
cending F-equation (4). But from well known properties of the hypergeometric 
function, one verifies immediately that 
T'(a+a) [(b+a) 


y(z,0) = Tiessa) al (@ +a, b+; ¢+a;2) (25) 


has all the required properties. 
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Finally one obtains from (5) with z=¢ 
1 Car Oa a a—c . . 
¥ (2,0) = Fe 4a) get OTE hae) HOte— 0 F(a 4+ 6,0 + G6) C4125 2) (26) 
A whole set of other solutions is obtained if one replaces the hypergeometric 


function F(a+a, b+a;c-+a;z) by one of the functions 


(“= Aaa +a,c—b;c+ua; +) : 


(f= 2) (6 a,c bc 7 ap 2), 


TP(cta) (ec —a—b—a) (a4 a,bta;atbta—c+1;1—2), 


th —a-a% ‘ = 
Fiecay 2 of, (ata;1—ce+a;1—b+a; 2). 
But, of course, all these solutions can be expressed in terms of any two which 
are linearly independent. 
In each of these examples, the hypergeometric function ,/,(A, B; C; w) can 
be replaced by 
eo op ra pineahatOrn) 
ata, BS OM) rare at) 


i PAA Bo a 


with A’=A—C+i1, B'=B—C+1; C’=2—C. Thus one obtains other forms 
of the solutions. 
Case 2. The polynomial 7) +7,2z-+7,2 has two equal roots. Using the lemma, 


one can assume that 7,=7,=—0, 7,=1. We put g=a(a—c+1), s,=2a—c. 
Then the following results, which can be derived similarly as in Case 1, hold: 


2 y""(z, 0) + [89 + (24+ 2a — e+ 2) 2] y"(z,0) + 


) ) 
y (2,0) =(—1)82-**P(a+a) Fy (a+a;0; 2), 


(De 3 ,2at+2a—c 
PU, 2) = Raa ige eee ise 


gata—e So 


ye) = Fapemepy? “Filet ase). 
Instead of the confluent hypergeometric function, ,/, (a+a; (ie =a) one can also 
a 


take the function 


1% (a a5 03 =O erat ") (a) LF, (a te Oar G tite Leptyy Oe a 


A simple special case is sy=0, which however, will not be discussed further. 


Case 3. The polynomial 7)+7,2+-r,2 has only one single root. One there- 
fore assumes 7,=0, %4==1, 77>=0. Here we must distinguish between Ss; = 0 and 
5,=0. 
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Subcase 3a. s,=-0. Then one can put s,=—1 without loss of generality. 
Introducing the constants c=s)+1, a=— q,, we obtain 


zy'"(z, a) + (e+ a — 2) y"(z,0) — (a+) y(z,a) =0, 
y (2, a) Sree ee ie COs a) 


D(z, a) = T(a--a) Ca pare t. 


1 = 2 Cae 
y (z, a) Sacre: poe lla +o, CF ay 2). 


A further solution is obtained with the same replacement of the confluent hyper- 
geometric function ,F, by ,;%, as given in Case 2. 
Subcase 3b. Let s,=0. Then 


2 Y"(z, 0) +b (So + % + 1) ¥"(2,%) + Go ¥(%,%) = 0, 
y (2,0) = (= 1)? gs® 2 OF" F,.4 (Y/4q02), 
OE) (— Ga, 
YV(z,0) = go abot 7. (1/4902). 
The Bessel function in these formulas can be replaced by the Neumann 
function or by one of the Hankel functions with the same argument and order. 


Case 4. The polynomial 7)+ 7,2-+-7,27 reduces to a constant, which is assumed 
to be 1. Then we again have to distinguish between the cases s,=+-0 and s,=0. 


Subcase 4a. Let s,=+-0. Without loss of generality we assume s;=1, sg=0 
and put g=1+ 4. Then 


yi" (z, a) + 2 y"(z, a) + (1+ 4+) (2,0) =0, 


y (2,0) =(— 1)Fexp(— 4) Daral@), 
ctie 2 
P(2,0) = Fata) exp(5); 


1 z 
T'(a+a+1) exp (7) Data (2). 


Instead of the function of the parabolic cylinder D,,,(z), one can also take 
the following function: 


Y(z,«) = 


P(a+a+1)%D_q-4-1(t2)- 


Subcase 4b. Let s,=0. In this case the differential equation (20) become 
independent of «. Considering all possible values of sy and gg, one arrives at the 
following pair of solutions (a =+-0): 


* \ , ’ + 
+ oe : < . : 
” “tl 8 
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. 4, Remarks and discussion : # * 


In the foregoing results a constant factor (constant with respect to both 
variables z and «) can always be added in y(z, «) as well as in Y(@, a) . Further- 
more, the results remain correct if y(z, «) and Y(z, «) are multiplied ee periodic 
function of « with period 1. One also sees immediately that y(z,«), O(z, «), 
Y(z, «) can in turn be changed into Y(z, —a«), D(z, —a) +4, y(z, —a) to give a 
solution with the properties mentioned in Section’. Although one does not 


obtain new solutions in this way, the totality of solutions having been exhausted — 


by the cases 1 to 4 to within linear transformations of the independent variable, 


it may, however, be convenient to put the solutions into a different form in this — 


way. 


treated; it is easy to make the necessary modifications in every case. 

Of course, the limiting cases 2 to 4 can also be obtained by going to the 
respective limits not in the differential equations, but in the solutions themselves, 
y(z, x), D(z, «), Y(z, a), of Case 1. Therefore everything is theoretically contained 
in Case 1, explicitly in the formulas (24), (25), (26) and in those which arise by 
replacing a by —a and y, ®, Y by Y, @4, y. 

We repeat that the solutions y(z,«) of the ascending F-equation written 
down explicitly in the Cases1 to 4 satisfy the functional equation (7) with 
dzid&=1, and furthermore we remark that (7) and (4) can be combined into the 
difference equation or the recurrence relation 


Q(z, D(z, «— 
y (2, 0+ 1) +S y (z, a) — SES (2,4 —1) =0. 


Legendre functions are special cases of hypergeometric functions and can be 
expressed in terms of these in various ways. This gives rise to many functions 
y(z,a) that can be expressed by Legendre functions. However, we shall not go 
into the details here. 
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Special situations, such as terminating sequences y(z,«), are not explicitly — 
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